Советы учителя — Звуко-буквенный (фонетический) разбор слова, учитель начальных классов в Москве
Фонетика — раздел науки о языке, изучающий звуковые средства. Фонетические знания и умения необходимы для формирования всех четырех видов речевой деятельности человека: слушания (аудирования) говорения, чтения и письма.
Для того чтобы адекватно воспринимать слышимую речь, нужно иметь развитый фонематический слух, благодаря которому мы различаем слова по их звучанию, фонетические способности помогают нам по интонации улавливать смысл, который говорящий вкладывает в высказывание. Поскольку русское письмо звуко-буквенное, читающий оперирует в процессе чтения звуками. Отсюда требование: исходным пунктом в обучении чтению должна стать ориентировка в звуковой действительности языка. В настоящее время обучение грамоте по любому букварю начинается с до буквенного периода, когда учащиеся на практике осваивают фонетику.
Фонетические знания и умения важны для всего последующего обучения чтению и письму. Например, такое качество чтения, как выразительность, нельзя сформировать, не познакомив учащихся с интонацией, логическим ударением. Фонетические умения — необходимая база для становления осознанных навыков правописания, без них нельзя сформировать орфографическую зоркость учащихся.
На фонетику мы опираемся и при обучении лексики, грамматике, морфемике.
Выполняя фонетический разбор в школе, ученик должен уметь выделять гласные и согласные звуки, соотносить их с буквами.
- Буквы – это графические знаки, с помощью которых на письме обозначаются звуки. Полного соответствия между звуками и буквами нет.
- Гласные звуки
В русском алфавите всего 33 буквы.
Две из них — Ь и Ъ не относятся ни к гласным, ни к согласным буквам, звуков не обозначают. Гласные буквы: бывают ударными или безударными, образуют слоги. Сколько в слове гласных звуков, столько и слогов.
Гласных букв 10: а, о, у, э, ы, я, ё, ю, е, и.
Гласных звуков 6: [а], [о], [у], [э], [и], [ы].
А, О, У, Э, Ы – обозначают твёрдость согласных звуков.
Я, Ё, Ю, Е, И – обозначают мягкость согласных звуков. - Йотированные гласные буквы (буквы, обозначающие два звука). Обозначают два звука, если стоят:
Я — [jа] Ю- [jу] Е – [jэ] Ё – [jо]
* в начале слова (ель, яблоко, юла)
* после Ъ и Ь (съем, семья, подъём, вьюн)
Буквы е, я, ю, ё обозначают один звук [э], [а], [у], [о] после согласного только под ударением: век — [в’эк], мяч- [м’ач’], блюз — [бл’ус], мед — [м’от]
В безударном положении эти буквы после согласного обозначают звук [иэ]
ряды [р’ и д ы] лесок [л’ и с о к] - Согласные звуки
Согласных букв 21: н, м, л, р, й, б, в, г, д, ж з, п, ф, к, т, ш, с, х, ц, ч, щ.
Согласных звуков в русском языке – 36. - Согласные звуки образуют 6 пар звонких и глухих согласных:
- [б] — [п], [в] — [ф],[г] — [к], [д] — [т], [ж] — [ш], [з] — [с].
- Кроме того, согласные звуки образуют 15 пар твёрдых и мягких согласных:
- [б] -[б’], [в] — [в’], [г] — [г’], [д] -[д’], [з] — [з’], [к] — [к’],[л] — [л’],[м] — [м’],
- [н] — [н’],[п] — [п’], [р] — [р’], [с] — [c’], [т] — [т’],[ф] — [ф’], [х] — [х’].
- Сонорные звуки: [л], [м], [н], [р], [й].
- Пять непарных глухих звуков: [х], [х’] [ц], [ч’], [щ’].
Всегда твёрдые согласные звуки: [ж], [ш], [ц].
Всегда мягкие согласные звуки: [ч’], [щ’], [й’].
План фонетического разбора
1. Запишем слово.
2. Поставим ударение.
3. Запишем справа транскрипцию слова, разделим его на слоги.
4. Охарактеризуем все звуки, записывая их сверху вниз:
4.1. ударный-безударный для гласных;
4.2. звонкий-глухой (пара), твёрдый-мягкий (пара) для согласных;
5. Подсчитаем количество звуков и букв
Образец:
морковь мор-кóвь 2 слога
м – [м] — согл., сонорн. непарн., тв. парн.
о – [а] — гласн., безуд.
р – [р] — согл., сонорн. непарн., тв. парн.
к – [к] — согл., глух. парн., тв. парн.
о – [о] — гласн., ударн.
в – [ф’] — согл., глух. парн., мягк. парн.
ь – [ ]
___________________________
7 букв, 6 звуков
Орфограмма — это место в слове:
- где пишется не так, как слышится;
- где звук слышится неясно;
- где возможна ошибка;
- где при письме возникает трудность;
- где требуется применение правила;
- где для обозначения определенного звука нужно выбрать букву.
Морфологический разбор слов онлайн, морфология в русском языке
Морфология — раздел науки о языке, который изучает слово как часть речи. Морфологический разбор слова — анализ морфологии и морфологических (грамматических) признаков слова с учетом части речи, к которой слово относится.
Слова с буквой ё пишите через букву ё (не через е!). Пчелы и пчёлы или слезы и слёзы — разные слова, имеющие разные морфологические разборы.
При морфологическом разборе определяют, какие у слова:
- Часть речи;
- Морфологические признаки;
- Синтаксическая роль в предложении или словосочетании.
Морфологические признаки бывают постоянные и непостоянные. У неизменяемых частей речи непостоянные признаки отсутствуют.
morphologyonline.ru — сервис морфологического разбора любого русского слова в режиме онлайн. Так как при разборе анализируется слово без контекста (мы не знаем словосочетания или предложения, в которое слово входит), то определение синтаксической роли выходит за рамки морфологического разбора нашим сервисом.
Обращайте внимание на значимость буквы ё в словах. Сравните: стёкла (сущ., мн. ч) – стекла (глаг., пр. в.), совершенный (идеальный) – совершённый (сделанный). Слова в подобных случаях имеют разные морфологические разборы.
Сайт содержит блок-схемы, таблицы морфологических признаков, примеры слов и исключения из правил. Для склонений, падежей, спряжений даны справочные материалы. Хорошей подсказкой служит сводная таблица морфологических признаков и синтаксических ролей частей речи русского языка, а также планы и примеры морфологических разборов.
Примеры разборов можно найти среди слов, запрошенных посетителями сайта: сделался, полузакрывая, бабье, произносилась, охранялась, зазывного, проницательностью, прирождённость, щётки, волонтёры, четвёртого, удаётся, шофёры, Николаевского, сложенный, приобретёт, поймёте, засмеётся, несравнимых, мёд, низвергалась, весёлого, весёлые, зелёных, весёлую, бережём, Мурино, самовластной, эксплутационный, берёзовый и другие. За всё время работы сайта посетители запросили более 1 млн слов в разных склонениях и формах.
Фонетический разбор. Алфавит. Графика. Орфография — Российская газета
Итак, на предыдущих занятиях мы учились писать сочинение — рецензию на авторский текст. За бортом нашего корабля остались такие темы, как слова исконные и заимствованные, устаревшие историзмы и архаизмы, неологизмы. И огромный пласт «Функциональные стили речи», куда входят разговорный, научный, официально-деловой, публицистический и художественный стили со своими особенностями лексики, морфологии и синтаксиса. Всё это есть в книге М. Карнауховой «Русский язык: понимаю — пишу — проверяю», которую можно приобрести в издательстве «Горная книга». Сегодня и в дальнейшем мы будем говорить об элементах языковой системы — фонетике и ее влиянии на орфографию, о самой орфографии, разборе слова по составу и словообразовании, морфологии и синтаксисе.
Занятие 9. Фонетический разбор. Алфавит. Графика. Орфография
Записывая слово, мы сначала его проговариваем про себя. Есть языки, где буквами алфавита на письме передаются все звуки, — в этом случае число букв и звуков в слове совпадает. В русском языке буквы передают не все звуки. Чтобы в этом убедиться, попробуйте написать на слух слово сдирает. У вас вполне может получиться «здираит» или «здераит». А почему? Потому, что вы записали на слух, а не по правилам грамотного письма приставку —с, корень —дир-, глагольное окончание —ет. Только в суффиксе —а— вы не ошиблись, поскольку на звук [а], обозначенный этой буквой, падает ударение.
Из этого поучительного примера следуют два вывода. Первый: наше письмо звуко-буквенное и выработка стойких навыков правописания должна производиться с учётом звукового — фонетического — устройства слова. Второй: умение выделять морфемный состав слова, то есть приставку, корень, суффикс и окончание, — непременное условие грамотного письма.
Нормы литературного произношения зафиксированы в орфоэпическом словаре, написания слов — в орфографических словарях.
Начнём анализ звукового и буквенного состава русских слов с алфавита. Над буквой надпишем её название, под буквой в значке транскрипции основные звуки, которые соответствуют ей при произношении в слове.
Значком [ ] обозначается транскрипция; значком ` — мягкость согласного звука, есть также долгие согласные звуки, они произносятся, например, в словах
Здесь и далее может употребляться транскрипция части слова или одной буквы.
Комментарии.
1. Все гласные буквы имеют звуки, отражённые в представленной транскрипции, только под ударением. Гласным звукам принадлежит важнейшая функция в слове: на них падает ударение и они образуют слог.
Слог — звук или группа звуков, которые произносятся одним напором выдыхаемого воздуха. В русском слове ударение только одно и столько слогов, сколько гласных звуков — на письме, соответственно, букв, например: эхо — э-хо, безопасность — бе-зо-па-сность, карман — ка-рман, майка — май-ка, компас — ком-пас.
Внимание! В наших примерах отразилось слогоделение как явление фонетики, связанное со степенью звучности, которой обладают звуки. Самый большой индекс звучности — 4 — у гласных звуков, в образовании которых участвует голос. Далее идут согласный [й`] и сонорные согласные [л, м, н, р] с индексом звучности 3, в образовании которых участвуют голос и шум. Наконец, все остальные согласные звуки со степенью звучности 1, в образовании которых участвует только шум и которые имеют общее название шумные. Граница слога проходит по границе степени звучности: после гласного звука (первые три слова) или после согласного [й`] и сонорного согласного, если за ними стоит шумный согласный (последние два слова). По правилам же и делить слово на слоги, и давать научную характеристику слогам можно только в фонетической транскрипции. В нашем случае важно отметить два момента:
1) слогоделение не всегда совпадает с правилами переноса слов;
2) по тому, какую позицию по отношению к уданому слогу занимают остальные слоги, они делятся на предударные и заударные (найдите их в приведённых словах). В безударной позиции большинство гласных звуков изменяют своё качество, например, часы [ч`иэсы], отчего и возникает вопрос о написании буквы на месте безударного звука.
В книге будут предложены задания на расстановку в словах ударения — проверяйте себя по орфографическому словарю.
2. Гласные буквы Е, Ё, Ю, Я уже в самом названии букв имеют два звука. При этом первый звук [й`], а второй как у соответствующего гласного [э, о, у, а]: Е [й`э], Ё [й`о], Ю [й`у], Я [й`а]. Эти буквы могут при определённых позициях в слове, произноситься как два звука, например, юла [й`ула], а могут терять [й`], и тогда остаётся только вторая часть, например, люк [л`ук].
3. Почти все согласные буквы имеют звуки, которые могут произноситься в слове твёрдо и мягко, то есть образуют пары по твёрдости-мягкости: произнесите, например, звук буквы Н в словах ныл [ныл] — Нил [н`ил]; кон [кон] — конь [кон`].
Лишь шипящие звуки [ж, ш, ш`, ч`] на месте согласных букв Ж, Ш, Щ, Ч, свистящий звук [ц] на месте буквы Ц и звук [й`] на месте буквы Й не имеют этой двойственности:
а) звуки [ж, ш, ц] только твёрдые: невозможно произнести «[ж`ивот]» — только [жывот], хотя в этом слове и пишется после Ж буква И;
б) звуки [ч, ш`, й`] только мягкие: сравните абсолютно одинаковое произношение конечных согласных звуков в словах дочь и мяч, несмотря на наличие или отсутствие на письме Ь.
Задание. Известно, что букве Щ соответствует мягкий долгий звук [ш`]. Писать надо ту букву, звук которой произносится: шар [шар], мещане — ме[ш`а]не, шум [шум], щука — [ш`у]ка, школа, банщик. Однако есть слово, где произносится звук [ш], а пишется буква Щ, означающее «человек, оказывающий помощь». Что это за слово?
4. Мы видим, что согласные буквы Б, В, Г, Д, Ж, З могут произноситься, соответственно, как звуки [п], [ф], [к], [т], [ш], [с], например, в словах зуб [зуп], всё [фс`о], миг [м`ик], год [гот], нож [нош], воз [вос]. А буквы П, Ф, К, Т, Ш, С в определённой позиции слышатся как [б], [в], [г], [д], [ж], [з]: обкрадывать (о[п]крадывать), отгородить (о[д]городить), сбить [збит`] и т. д. То есть данные согласные звуки образуют пары по глухости-звонкости [б]-[п], [в]-[ф], [г]-[к], [д]-[т], [ж]-[ш], [з]-[с]. Причём все эти звуки, кроме [ж] и [ш], могут быть также мягкими: сравните, например, произношение звука на месте буквы Б в словах быть, бить, дуб, дробь.
Остальные согласные звуки непарные по признаку глухости-звонкости: звуки [й`, л, м, н, р] на месте букв Й, Л, М, Н, Р только звонкие, звуки [х, ц, ч`, ш`] на месте букв Х, Ц, Ч, Щ только глухие. Эти звуки по данному признаку не зависят от занимаемой позиции в слове и не изменяются в процессе говорения.
Задание. Укажите слово, в котором произносится звук [з]:
1) рассказ 2) сбоку 3) резкий 4) слово
5. Буквы Ъ и Ь звуков не обозначают. Зачем в языке нужны буквы, не имеющие звуков? Они используются только на письме для обозначения:
а) определённого звучания слова, например, в слове моль звук [л`] на конце произносится мягко, а показано это при помощи Ь;
б) грамматического показателя слова или формы слова. Например, на конце слов купаться и купается слышится [ца], но пишутся эти слова в соответствии со своей грамматической формой;
в)разделения в словах согласных звуков и гласных с [й`], например, съел [сйэл], пью [п`йу].
Итак, буква может в слове иметь тот же звук, что и вне его, например, час [час], дубы [дубы] — тогда звук находится в сильной позиции, а звуковое значение буквы называется основным. Буква в слове может иметь не тот же звук, что вне слова, например, часы [чиэсы], дуб [дуп] — тогда звук находится в слабой позиции, а звуковое значение буквы называется второстепенным. Правила передачи основных звуковых значений букв на письме регулирует графика. Правила передачи второстепенных значений — орфография.
Задание. Укажите номер (номера), где неправильно поставлено ударение в словах. Проверьте себя по орфографическому словарю, а если не знаете значения слова, то по толковому. Затем сверьтесь с ответом:
1) a`лкоголь 5) парте`р
2) то`рты 6) ана`том
3) красиве`йший 7) жалюзи`
4) отку`порить 8) каучу`к
Ответ: 1, 3,
Задание. Отгадайте слова по их звуковой характеристике и запишите.
1. 1-й звук — твёрдая пара звука [р`], 2-й звук — гласный [у], 3-й звук — глухая пара звука [г], 4-й звук — гласный [а].
2. 1-й звук — мягкая пара звука [л], 2-й звук — гласный [и], 3-й звук — глухая пара звука [б], 4-й звук — гласный [ы].
3. 1-й звук — непарный мягкий глухой звук [ч`], 2-й звук — гласный [а], 3-й звук — мягкая глухая пара звонкого звука [з], 4-й звук — мягкая глухая пара звонкого звука [д]. Букв в этом слове больше, чем звуков, на одну единицу.
4. 1-й звук — гласный [э], 2-й звук — глухая твёрдая пара звука [д`], 3-й звук — гласный [а], 4-й звук — парный твёрдый [ш], который не совпадает с написанной буквой.
5. 1-й звук — мягкий непарный согласный [й`], 2-й звук — гласный [э], при этом оба звука обозначают одну гласную букву; 3-й звук — мягкая пара твёрдого звука [л]. Количество букв и звуков в этом слове совпадает.
(PDF) Вклад синтаксического анализа в просодическую фразировку в экспериментальной системе преобразования текста в речь
Просодическое деревооставило некоторые вопросы открытыми. предложение (например, понятие
[что он воздержится от такого действия] было
неверным.) Мы циклически включаем вложенные предложения в просодическое дерево
, чтобы гарантировать, что материал
во вложенном предложении обрабатывается до
, что в основном предложении.6 Дополнительно. Джи и
Грожан оставляют открытой обработку множественного
правого вложения несентенциальных составляющих,
, например, вложения NP в Уничтожение хорошего
имени его отца. Наш подход состоит в том, чтобы обрабатывать эти
случаев рекурсивно, от наиболее глубоко встроенной фразы
вверх, чтобы сохранить просодическую сплоченность
всей НП.
Наши правила присоединения по большей части получены из отчета Селкирка
.Мы также использовали идею
, которую Джи и Грожан ([983) в значительной степени заимствовали из
работы Селкирка, — что определенные синтаксические заголовки отмечают
фонологических границ фраз и обеспечивают
основных просодических составляющих для анализ более высокого уровня.
Наши правила просодии проходят в четыре независимых этапа.
Каждый этап строится на предыдущем этапе, так что правила
могут ссылаться как на синтаксическую, так и на просодическую структуру
, поскольку они создают последовательно более высокие уровни просодической структуры
.
(i) Правила присоединения орфографически объединяют
различных слов в фонологические составляющие без внутренней границы слова
, они присоединяют слово к его левому
или правому соседу в зависимости от (а) категории слова
, и (б) его структурное отношение к другим словам. В
общих смежных словах являются служебные слова —
артиклей, дополняющих, вспомогательных глаголов,
союзов, предлогов и местоимений (за исключением
сильных притяжательных падежей, мое, ее, их, ваше, наше,
, которые рассматриваются как обычные НП).
Присоединение встречается шесть раз для предложения в
Рисунок 2 для создания шести групп слов, все справа —
смежных: на каждой, в 48-канальном, может включать, эхо,
, которые есть и в этом. Эти группы соединенных слов
появляются как терминалы в дереве просодии на рисунке 2. При последующей обработке
границы между
слов в этих группах помечаются так, что речевая система преобразования текста в
не создает prosodic
указания границы слова.Кроме того, эти группы
рассматриваются как отдельные слова в дальнейшем анализе.
(ii) ~ -Фразовые Правила создают фонологические (или 6p) фразы
, которые являются строительными блоками дерева просодии
. Эти правила определяют группы слов, которые сильно связаны в речи
и, следовательно, не должны быть разделены границами фраз
. В данной реализации
каждая фраза создается с помощью процесса
слева направо, который собирает слова, образованные присоединением, до тех пор, пока
не дойдет до существительного или глагола.На этом этапе создается фраза
, состоящая из собранных слов плюс
существительного или глагола, который выступает в качестве заголовка фразы. Например, для
на этой полке на Рисунке 2. представлена одна фраза
, состоящая из двух слов.
На рисунке 2 узлы, помеченные синтаксической категорией
, являются минимальными фонологическими составляющими
по отношению к более поздним правилам, которые строят просодические
s.Приняв этот стронный подход, мы теперь понимаем
ограниченных исключений из этого механизма, который мы обсудим ниже ».
фраз; эти @ фразы имеют внутреннюю структуру,
, но эта структура не играет никакой роли в дальнейшей обработке.
Обратите внимание, что ни прилагательные, ни наречия не могут быть
в качестве заголовка • фразы, так что три дополнительных
открытых слотов представляют собой одну • фразу, состоящую из четырех слов.
Примеры, такие как Кто-то высокий вошел в комнату,
, однако, предполагают, что наша трактовка этих категорий
недостаточно детализирована и что в будущих версиях системы
некоторые прилагательные и наречия
должны действовать как • головы.
(iii) Правила просодии используют информацию о
фразах и синтаксической структуре для создания новой
организации предложения и для присвоения значений силы
границам между последовательными • фразами.
Процесс построения дерева просодии начинается с
узла предложения (S или Sbar), который наиболее глубоко
встроен в высказывание, преобразуя его в поддерево просодии
. Этот процесс продолжается через
последовательно более высоких уровней узлов предложений, пока все
предложений верхнего уровня не будут преобразованы в
поддеревьев просодии. Вся обработка каждого
последовательных предложений выполняется до того, как будет рассмотрена связь
предложений друг с другом7
Внутри предложения • фразы обрабатываются
слева направо.На этом этапе анализа используется окно
, которое позволяет получить доступ к трем соседним узлам.
Правила действия шаблона, которые описаны ниже, применяют
к узлам в окне и создают поддеревья просодии
, которые заменяют узлы синтаксиса. Эти поддеревья
возглавляются • узлом, содержащим число, которое
представляет собой количество узлов; число определяется как
, подсчитывая количество узлов, содержащихся в поддереве
, плюс 1 для узла, который возглавляет поддерево
.В общем, правила просодических фраз выполняют три функции:
:
(a) Уравновешивают просодические фразы, обращаясь к составляющей длине
. Это правило применяется только для построения
поддерева просодии, содержащего глагол. Если количество узлов
для подлежащего плюс глагола меньше, чем количество узлов
дополнения глагола, то подлежащее и глагол
группируются вместе в просодическое поддерево; это дает
формулировку в символах справа — отметьте
характерных черт.В противном случае глагол группируется с
его дополнением в просодическом поддереве; пример
, эта группировка является поддеревом для может питать только эхо.
компенсаторов на рис. 2,
(b) Объедините • фразу дочери основных
составляющих, исключая VP, в просодическое поддерево.
В настоящее время это правило применяется только к NP и PP, поскольку
прилагательных и наречий в настоящее время не рассматриваются как @
головы.Например, имя персонажа, которое
образует две d ~ фразы под NP (имя и символ
), становится одной просодической фразой, которая заменяет NP
.
7, Мы обнаружили по крайней мере один класс фраз, для которых этот порядок обработки
кажется неподходящим. В них заголовок
фразы верхнего уровня — это эпистемология, например, верить, знать, верить,
знания, а ее дополнение — это предложение.В большинстве случаев
текущий порядок обработки вложенных предложений будет
создавать разрыв между заголовком и последующим вложенным предложением
. Однако для этого класса предложений thd break does
не кажется подходящим. «~ Несмотря на то, что
будет просто обработать это как исключение, в настоящее время мы изучаем
, есть ли более принципиальные меры?», Чтобы описать, что
должно быть сделано в этих случаях.
s Только узлы верхнего уровня, которые содержат заголовок
— тактической фразы, учитываются при вычислении количества узлов.
LnU ~, ~ ‘- ~ y ~: Lv ~ …. ~ am ~ lev • в Fi ,, ure -, «~ подфразовое ветвление’ ot»
Левая и силовая единица c ~ они не влияют на количество узлов.
149
% PDF-1.5 % 216 0 объект > эндобдж 217 0 объект > поток DOI: 10.1073 / pnas.17015
application / pdf10.1073 / pnas.17015
http://dx.doi.org/10.1073/pnas.17015
2017-04-20false10.1073/pnas.17015
2017-04-20false
DECtalk Guide Datasheet от Parallax Inc.
Авторские права и товарные знакиFonix DECtalk: 5.01-E1 Руководство пользователя
4
Авторские права и товарные знаки
ВАЖНО! ПРОЧИТАЙТЕ ДАННОЕ ЛИЦЕНЗИОННОЕ СОГЛАШЕНИЕ ПЕРЕД ЗАГРУЗКОЙ, ОТКРЫТИЕМ ИЛИ
ИСПОЛЬЗОВАНИЕМ ДАННОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ. ЗАГРУЖАЯ, ОТКРЫВАЯ ИЛИ ИСПОЛЬЗУЯ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ, ВЫ
УКАЗЫВАЕТЕ О ПРИНЯТИИ ВАМИ ПОЛНОГО СОГЛАШЕНИЯ.
ЛИЦЕНЗИОННОЕ СОГЛАШЕНИЕ НА ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ
Это Соглашение является юридическим соглашением между вами и SpeechFX, Inc. (в совокупности
именуется «SFX»), но может быть заменено отдельным лицензионным соглашением, которое вы подписали
и SFX. .Программное обеспечение в этой загрузке («Программное обеспечение») и документация
(совместно именуемые «Продукт») защищены законом об авторских правах и других законах об интеллектуальной собственности
и международными соглашениями. У вас нет права собственности на Продукт или права собственности на него, кроме
вашей загрузки. SFX оставляет за собой все права, прямо не предоставленные в этом Соглашении.
ИСПОЛЬЗОВАНИЕ И ОГРАНИЧЕНИЯ: Вы можете использовать Программное обеспечение только на одном компьютере или одном электронном устройстве
. Вы можете сделать только одну копию Программного обеспечения.Программное обеспечение
не включает обновления, обслуживание или поддержку, которые могут быть доступны отдельно. Вы не можете изменять, адаптировать, переводить, сдавать в аренду, сдавать в аренду, ссужать, перепродавать с целью получения прибыли, распространять, объединять в сеть или создавать производные работы
на основе любой части Программного обеспечения. Вы не можете подвергать обратному проектированию,
декомпилировать или дизассемблировать Программное обеспечение.
ОГРАНИЧЕННАЯ ГАРАНТИЯ: SFX НЕ ДАЕТ НИКАКИХ ГАРАНТИЙ, ЯВНЫХ ИЛИ ПОДРАЗУМЕВАЕМЫХ, И
ОТКАЗЫВАЕТСЯ ОТ ЛЮБЫХ ПОДРАЗУМЕВАЕМЫХ ГАРАНТИЙ КОММЕРЧЕСКОЙ ЦЕННОСТИ ИЛИ ПРИГОДНОСТИ ДЛЯ КОНКРЕТНОЙ ЦЕЛИ
.SFX не гарантирует, что Продукт не содержит ошибок. ПОЛНАЯ ОТВЕТСТВЕННОСТЬ SFX
ЗА ЛЮБЫЕ ПРЕТЕНЗИИ ИЛИ УЩЕРБ, ВЫЗВАННЫЙ ИСПОЛЬЗОВАНИЕМ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ИЛИ НЕВОЗМОЖНОСТЬЮ
ИСПОЛЬЗОВАТЬ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ, ОГРАНИЧИВАЕТСЯ ПРЯМЫМ УБЫТОМ, КОТОРЫЙ НЕ ДОЛЖЕН ПРЕВЫШАТЬ ПРЕВЫШАЮЩИЙ ЛИЦЕНЗИОННЫЙ СБОР. НИ ПРИ КАКИХ ОБСТОЯТЕЛЬСТВАХ SFX НЕ НЕСЕТ ОТВЕТСТВЕННОСТИ ЗА ПОТЕРЮ ПРИБЫЛИ
, УТЕРЮ ДАННЫХ, ПЕРЕРЫВ В ДЕЯТЕЛЬНОСТИ ИЛИ ЛЮБЫЕ СЛУЧАЙНЫЕ ИЛИ
КОСВЕННЫЕ УБЫТКИ, ВЫЗВАННЫЕ ИСПОЛЬЗОВАНИЕМ ИЛИ НЕВОЗМОЖНОСТЬЮ ИСПОЛЬЗОВАТЬ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ
, СООТВЕТСТВУЮЩИМ СООТВЕТСТВУЮЩИМ СООТВЕТСТВУЮЩИМ ПРОГРАММНЫМ ОБЕСПЕЧЕНИЕМ. ПОТЕНЦИАЛ НА ТАКОЕ УБЫТКУ ИЛИ УБЫТКУ
.Вышеуказанные ограничения могут быть отменены законом в некоторых юрисдикциях.
ОГРАНИЧЕННЫЕ ПРАВА ПРАВИТЕЛЬСТВА США: Программное обеспечение и любые сопутствующие материалы
предоставляются с Ограниченными правами. Использование, копирование или раскрытие правительством
подлежит ограничениям, изложенным в подпункте (c) (1) (ii) Правил в технических данных
и пункте о компьютерном программном обеспечении в DFARS 252.227-7013 или подпунктах (c ) (1) и (2) из
Ограниченные права на коммерческое компьютерное программное обеспечение в 48 CFR 52.227-19, если применимо.
Подрядчик / производитель — SpeechFX, Inc. по адресу 310 East State Road, Suite 10, American
Fork, UT 84003.
ОБЩИЕ ПОЛОЖЕНИЯ: Если какое-либо условие настоящего Соглашения будет признано недействительным или не имеющим исковой силы, все остальные условия
останутся в силе. в полной силе и действии. Настоящее Соглашение регулируется внутренним законодательством
штата Юта. Если вы нарушите какое-либо условие настоящего Соглашения, SFX может прекратить действие этой лицензии, и вы
должны вернуть все копии Продукта в SFX.
Copyright © 2012 SpeechFX, Inc. Все права защищены.
Товарные знаки
Логотип Fonix и DECtalk являются товарными знаками SpeechFX, Inc.
8.1 Древовидные диаграммы — Основы лингвистики
Этот модуль знакомит с базовым словарем древовидных диаграмм. Древовидные диаграммы — это обозначения, которые большинство синтаксиков используют для описания того, как предложения организованы в ментальной грамматике.
Проверьте себя
На следующей древовидной диаграмме:
1.Каковы структурные отношения между V loves и NP sushi ?
- V и NP сестры.
- V — мать NP.
- V — дочь Н.П.
- V и NP не связаны ни одним из этих трех способов.
2. Каковы структурные отношения между NP Colin и V loves ?
- NP и V — сестры.
- НП — мать В.
- НП — дочь В.
- NP и V не связаны ни одним из этих трех способов.
3. Какой узел является сестрой NP Colin ?
Видео скрипт
Мы собираемся начать изучение того, как предложения организованы в нашей ментальной грамматике. Прежде чем мы это сделаем, нам нужно познакомиться с определенным видом нотации, называемым древовидной диаграммой . Мы увидим, что в каждом предложении слов сгруппированы в фраз . Фразы могут быть сгруппированы вместе, чтобы образовать другие фразы, и образовать предложений .Мы используем древовидные диаграммы, чтобы изобразить эту организацию. Их называют древовидными диаграммами, потому что у них много ветвей. : каждая из этих маленьких линий, соединяющих элементы диаграммы, является ветвью.
Каждое место, где сходятся ветви, называется узлом . Узлы обозначают набор слов, которые действуют вместе как единое целое: каждый узел соответствует группе слов, называемой составляющей , о которой вы узнаете в другом модуле. Если у узла нет дочерних узлов, мы называем его конечным узлом .
В рамках древовидной диаграммы мы также можем говорить о взаимосвязях между различными частями дерева. Каждая ветвь соединяет два узла. Высшая называется матерью , а нижняя — дочерней . У матери может быть несколько дочерей, но у каждой дочери только одна мать. И, как и следовало ожидать, если у двух дочерей одна и та же мать, мы говорим, что они сестры, друг другу.
Наличие этого словаря древовидных диаграмм позволит нам говорить о синтаксических отношениях между частями предложений в нашей ментальной грамматике.
Межлингвистические различия в использовании длительности сигналов для сегментации нового языка
Одна из ключевых проблем в исследовании усвоения языка — определение механизмов, которые люди используют для сегментации непрерывной речи на дискретные последовательные составляющие, такие как слова, фразы и предложения. При синтаксическом анализе используется широкий спектр подсказок. Поскольку реплики сегментации интегрированы иерархически, слушатели должны присвоить разные веса каждой реплике.Сегментируя речь на родном языке, взрослые слушатели уделяют наибольшее внимание лексико-семантической и синтаксической информации (Mattys, White, & Mehlhorn, 2005). Когда слушатели обрабатывают речь на новом языке или на языке, на котором они не очень бегло говорят, эта информация не всегда доступна. Целый ряд исследований показал, что, хотя самые мощные и информативные сигналы недоступны для людей, сегментирующих речь на новом языке, они, тем не менее, могут успешно справляться с задачами сегментации (Pilon, 1981; Wakefield, Doughtie, & Yom, 1974).В отсутствие лингвистической информации более высокого уровня слушатели полагаются на другие сигналы, включая сегментарные (фонотактические, аллофонические) и просодические (продолжительность, интенсивность, высота тона) сигналы, которые сигнализируют о лексическом ударении, а также другие уровни значимости и границы фраз. (Langus, Marchetto, Bion, & Nespor, 2012; Ordin & Nespor, 2013; Toro, Pons, Bion, & Sebastián-Gallés, 2011; Vroomen, Tuomainen, & de Gelder, 1998). Различия в вероятностях перехода (TP) между соседними слогами в словах или пересечения границ слов также используются для сегментации слов из искусственного языка (Saffran, Newport, & Aslin, 1996), а также частотного распределения более и менее частых речевых составляющих. (де ла Крус-Павия, Элордиета, Себастьян-Галлес и Лака, 2014 г .; Жервен, Себастьян-Галлес, Диас, Лака, Мазука, Ямане, Неспор и Мехлер, 2013 г.).
Среди различных просодических пограничных сигналов для целей сегментации большое внимание было уделено исследованию использования продолжительности. Продолжительность — один из самых надежных и последовательных пограничных знаков, отмечающих конец фразы. Окончательное удлинение — увеличение продолжительности слогов и сегментов вблизи границы правого края с удлинением, пропорциональным силе границы (Turk & Shattuck-Hufnagel, 2007; Whightman, Shattuck-Hufnagel, Ostendorf, & Price, 1992) — имеет был найден во многих языках и считается универсальным.Christophe, Peperkamp, Pallier, Block и Mehler (2004) и Saffran et al. (1996) обнаружили, что взрослые и младенцы чувствительны к окончательному удлинению и могут использовать его для целей сегментации. Это было дополнительно подтверждено в ряде исследований (Kim, Broersma, & Cho, 2012; Langus et al., 2012; Tyler & Cutler 2009, среди других). В этих исследованиях участникам приходилось сегментировать потоки искусственного языка. Слова в языке были составлены с использованием ограниченного набора слогов и объединены без вставки пауз, так что TP между соседними слогами в словах были единственной подсказкой к границам слова, будучи выше, чем TP между соседними слогами, пересекающими границы слов.Таким образом, провалы в TP обозначили границы между статистическими словами. Как показано в Aslin, Saffran, and Newport (1998), этой информации достаточно для сегментации искусственного языка, когда в речевой поток не используются другие реплики. Взрослые слушатели, как и ожидалось, могли надежно разбивать речь на статистические слова. Когда последний слог слова удлинялся, сегментация была облегчена по сравнению с TPs-only, то есть с условием отсутствия просодии.Облегчающий эффект окончательного удлинения был задокументирован для носителей голландского, английского, французского и корейского языков (Kim, Broersma, & Cho, 2012; Tyler & Cutler, 2009). Было высказано предположение, что окончательное удлинение облегчает сегментацию, поскольку оно универсально и легко обнаруживается. Кроме того, удлинение, связанное с правым краем составляющей, не только лингвистическое явление: оно также наблюдается при обработке нелингвистических потоков, например музыки (Palmer, 1997), и связано с более общим механизмом, известным как закон ямба-хореи (ITL), который определяет предпочтение группировать элементы непрерывных потоков в единицы с более длинным элементом в конечном положении (Bion, Benavides-Varela, & Nespor, 2011; Hay & Diehl, 2007; Nespor et al., 2008). Это групповое предпочтение основано на общих слуховых механизмах и даже присутствует в визуальной модальности (Peña, Bion, & Nespor, 2011). Из-за своей универсальной природы было выдвинуто предположение, что окончательное удлинение будет использовано для сегментации нового языка независимо от первого языка слушателя (Kim et al., 2012; Tyler & Cutler, 2009).
Тем не менее, ряд межъязыковых фонетических и фонологических различий предполагает, что удлинение также демонстрирует межъязыковые различия в функциональности, и эти различия предполагают, что длительные реплики могут обрабатываться по-разному на разных языках.Удлинение используется для обозначения синтагматической значимости как на уровне слова, так и на уровне фонологической фразы (Gussenhoven, 2004). Использование значимости для сегментации очень хорошо задокументировано (например, Cutler & Norris, 1988; Cutler, Mehler, Norris, & Segui, 1992), и языки различаются (1) тем, как заметность проявляется в кросс-лингвистическом плане, и (2). ) в наиболее частом (т. е. немаркированном) расположении выдающихся слогов в словах и фонологических фразах. Кроме того, в некоторых языках используются контрасты длительности для фонематического различия коротких и долгих гласных, а также коротких и долгих согласных (Ladefoged & Maddieson, 1995).Наконец, стоит принять во внимание, что, хотя наличие окончательного удлинения подтверждено кросс-лингвистическим путем, его фонетическая реализация и область, в которой действует окончательное удлинение, зависят от языка (Nakai et al., 2012 для финского языка; Turk & Shattuck -Hufnagel, 2007; White & Turk, 2010; Wightman et al.1992 для английского; Cambier-Langeveld, Nespor, & van Heuven, 1997 для голландского; Frota, 2000 для португальского; Elordieta, Frota, & Vigário, 2005 для испанского и Португальский; D’Imperio, Elordieta, Frota, Prieto & Vigário, 2005 для других романских языков).Такие кросс-лингвистические различия в функциональной нагрузке и акустическом проявлении сигналов удлинения побуждают некоторых исследователей предполагать, что сигналы удлинения для сегментации неизвестного языка могут быть специфичными для языка и, по крайней мере, в некоторой степени, зависеть от первого языка (L1 ) слушателя (Bhatara, Boll-Avetisyan, Unger, Nazzi & Hoehle, 2013; de la Mora, Nespor, Toro, 2013; Ordin & Nespor, 2013; Ordin & Nespor, 2016; Toro & Nespor, 2015;). Ордин и Неспор (2013, 2016) показали, что немцы действительно используют удлинение как маркер границы фразы, и когда удлиненный слог в новом языке отмечает правый край дискретной составляющей, эффективность сегментации улучшается.Однако итальянцы не придерживаются этой общей схемы. Удлинение конечных слогов слова, а также удлинение начального слова в искусственном языке препятствовало сегментации итальянских слушателей, вопреки тому, что следовало ожидать, если бы окончательное удлинение повсеместно использовалось как маркер правой границы, облегчающий парсинг. Авторы утверждали, что облегчающий эффект окончательного удлинения был обнаружен только для языков, в которых преобладающее положение (например,, лексическое ударение) имеет тенденцию выравниваться с составляющими краями. Так как в итальянском известность не совпадает с краями слова, итальянские участники не могли однозначно интерпретировать удлинение как сигнал правого края. Удлинение произвело смущающий эффект на итальянских слушателей, которые более привыкли обрабатывать удлинение как коррелят лексического ударения, которое выравнивается с предпоследним слогом в их родном языке. Иверсен, Патель и Огуши (2008) подвергли сомнению универсальность ITL, выявив различия между английскими и японскими слушателями в ритмической группировке последовательностей тонов на фрагменты, предполагая, что основные слуховые процессы могут не быть универсальными.К такому же выводу пришли Bhatara et al. (2013), которые использовали лингвистические стимулы (слоговые последовательности), чтобы продемонстрировать значительные различия в восприятии длительных сигналов для разбиения непрерывного акустического потока французскими и немецкими слушателями. Немецкие слушатели надежно использовали удлинение как правый пограничный сигнал, в то время как французские слушатели демонстрировали противоречивые шаблоны группировки. Этот результат показал, что обработка сигналов удлинения, по крайней мере, частично модулируется языковым опытом.Toro et al. (2015) продемонстрировали, что крысы также развивают предвзятость обработки для разбора непрерывной речи на дискретные фрагменты, согласованные с воздействием, которое они получили. Более того, де ла Мора и др. (2013) сравнили использование сигналов высоты тона и длительности для анализа непрерывных акустических потоков людьми и крысами и пришли к выводу, что хореальная ритмическая группировка на основе высоты звука универсальна, в то время как группировка ямба на основе длительности может быть модулирована лингвистическим опытом ( для людей) или воздействия (для крыс).
Таким образом, пока нет четкого ответа, обрабатывается ли удлинение в новом языке универсально носителями с разными родными языками, как предполагают Тайлер и Катлер (2009) или Ким и др. (2012), или же оно согласуется с лингвистический ввод, как было предложено Ордином и Неспором (2013; 2016), Торо и др. (2015) или Bhatara et al. (2013). Учитывая противоречивые результаты, сообщаемые в литературе относительно использования удлинения для сегментации, мы решили проверить и уточнить гипотезу L1-специфического использования сигналов удлинения с большим набором языков, которые демонстрируют большее разнообразие в роли, которую удлинение играет в проявлении языковая структура (см. таблицу 1).Чтобы проверить эту гипотезу, мы приняли парадигму искусственного изучения языка (Saffran et al., 1996). Для участия в экспериментах мы пригласили носителей итальянского, немецкого и испанского языков, говорящих на одном языке, а также людей с преобладанием баскского языка. Эти языки демонстрируют важные различия в отношении удлинения (сводка различий представлена в таблице 1). В рамках одного исследования мы проверяем гипотезу на языках, которые (1) имеют тенденцию выравнивать ударение по краям составляющих (немецкий), (2) имеют тенденцию помещать ударение внутри составляющих (испанский и итальянский) и (3) имеют неконтрастивное подвижное ударение на лексическом уровне (гипускоанский баскский язык).Такой выбор языков позволяет сформулировать четкие прогнозы для проверки нашей гипотезы и уточнить различия в шаблонах результатов в предыдущих экспериментах. Более того, предыдущие исследования также различались по типу инструкций, данных участникам. В некоторых исследованиях инструкции были случайными, то есть участникам говорили, что они должны слушать воображаемый язык, имитирующий отношение, которое они могут иметь при прослушивании музыки или неизвестного языка. В других исследованиях инструкции были преднамеренными, т.е.е. участникам было предложено слушать воображаемый язык и обнаруживать и запоминать слова на этом языке. Потенциально на различия между исследованиями в полученных результатах со слушателями, говорящими на разных языках, могут влиять, среди прочего, случайные или преднамеренные инструкции. В этом исследовании мы решили дать слушателям преднамеренные инструкции. Одним из преимуществ этого подхода является то, что мы получаем сопоставимые результаты от носителей разных родных языков благодаря согласованности в процедуре.Во-вторых, мы можем сравнить производительность итальянских и немецких участников, получивших преднамеренные инструкции в текущем исследовании, с результатами, указанными в Ordin and Nespor (2013, 2016), где слушатели получили случайные инструкции. Это даст представление о влиянии различных инструкций, данных участникам, и более глубокое понимание того, как просодические функции взаимодействуют со статистическими сигналами при сегментации слов.
Таблица 1 Обзор фонетических и фонологических факторов, влияющих на удлинение в немецком, итальянском, испанском и гипускоанском баскских языкахМы пытались максимизировать различия в просодической структуре между языками, уделяя особое внимание роли удлинения в проявлении языковой структуры в акустическом речевом потоке.Межъязыковые различия должны позволять строить проверяемые гипотезы относительно того, как удлинение L1 слушателя влияет на стратегии сегментации, применяемые к новому языку, как удлинение используется для обнаружения дискретных составляющих в непрерывном акустическом потоке, если родной язык действительно влияет на использование удлинения с целью сегментации незнакомого языка.
Основным перцептивным коррелятом лексического ударения в итальянском языке является продолжительность (Bertinetto, 1980), особенно когда ударный слог является открытым и находится в предпоследней позиции, что является наиболее частым местом ударения в итальянском языке (Krämer, 2009; Nespor, 1993) .Ударные слоги в конце слова не удлиняются, за исключением случаев, когда этот слог также является финальным слогом (Rogers & d’Arcangeli, 2004). Гласные в открытых ударных предпоследних слогах значительно и существенно длиннее, чем в ударных предпоследних слогах из-за кумулятивного эффекта фонетического и фонологического удлинения предпоследних слогов и только фонетического удлинения предпоследних слогов (D’Imperio & Rosenthall, 1999). Таким образом, удлинение является особенно важным коррелятом ударения для носителей итальянского языка в предпоследних слогах.Итальянское фразовое преобладание выравнивается с ударными слогами слова (Nespor & Vogel, 2007) и добавляет дополнительную степень удлинения. Таким образом, мы ожидаем, что итальянцы с большой вероятностью будут интерпретировать известность в новом языке как особенность выдающегося слога, и, следовательно, удлинение предпоследнего слова может иметь облегчающий эффект для сегментации нового языка.
Немаркированное место лексического ударения в испанском языке также является предпоследним слогом (Roca, 1999; Delattre, 1965).Делатр (1965) говорит, что испанский язык обнаруживает сильную тенденцию располагать словесное ударение на предпоследнем слоге, и 74% трехсложных слов имеют ударение на предпоследнем слоге, в то время как только 6% слов имеют ударение на предпоследнем слоге, остальные В 20% слов ударение в конце слова. Как и в итальянском, наиболее устойчивым акустическим коррелятом стресса является удлинение, что справедливо даже для позиций без акцента (Ortega-Llebaria & Prieto, 2011, 2009). Таким образом, испанский и итальянский языки схожи в отношении важнейшего акустического и перцептивного коррелята лексического ударения и немаркированного местоположения лексического ударения.Следовательно, мы ожидаем, что испанские и итальянские слушатели будут вести себя одинаково и интерпретировать удлинение как коррелят лексического ударения. Однако, в отличие от итальянского, нет никаких свидетельств фонологического удлинения или различной степени удлинения, вызванного стрессом, в зависимости от местоположения ударения в испанских словах, которые могли бы снизить степень помощи для удлинения по сравнению с итальянскими слушателями.
Результаты относительно основных акустических коррелятов известности на уровне слов в немецком языке неубедительны (Isachenko & Schädlich, 1966, говорит, что F0 является более сильным акустическим проявлением лексического ударения в немецком языке, в то время как Dogil & Williams, 1999, говорит, что увеличение продолжительность имеет большее значение в акустическом проявлении стресса).Что касается перцептивных коррелятов, большинство исследований показывают, что эффект акустического удлинения на восприятие выступающего может быть легко преодолен движениями высоты тона и качеством гласных (Kohler, 2012). Различие в восприятии между заметными (как на уровне слова, так и на уровне фразы) и незаметными слогами основано на колебаниях высоты звука выше определенного порога, а длительность играет второстепенную роль в области восприятия (Fery, Hoerning, Pahaut, 2011; Isachenko & Schädlich, 1966; Nespor et al., 2008). Более того, восприятие выдающихся слогов в немецком языке больше связано с наличием полных гласных, а не сокращенных гласных (Kohler, 2012), в то время как в итальянском и испанском языках важность высоты звука как перцептивного коррелята лексического ударения менее важна и качественна. редукция (редукция гласного до шва в безударных слогах) практически отсутствует (Bertinetto, 1980; Ortega-Llebaria & Prieto, 2011). В отличие от испанского и итальянского, в немецком языке наблюдается фонематическая оппозиция между долгими и короткими гласными, и поэтому контраст длины между ударными и безударными слогами больше, чем в романских языках (удлинение, вызванное ударением, должно быть сильнее фонематических контрастов фонологической длины).Это, в свою очередь, делает немецкий язык менее чувствительным к меньшим различиям в соотношении продолжительности из-за стрессовых контрастов (Kohler, 2012). Еще одно важное различие в фонологии ударения между немецким и испанским / итальянским языками — это наиболее частое расположение лексического ударения. В словах германского происхождения ударение стоит в начале слова. В словах иностранного происхождения, составляющих значительную часть немецкого словаря, на расположение ударения влияют тяжелые слоги: длинные гласные и группы согласных сложных кодов обычно вызывают ударение (Dogil & Williams, 1999).Визе (1996) говорит, что предпочтение отдается предпоследнему ударению, если предпоследний слог открыт, и предпоследнему ударению в случае закрытого предпоследнего слога, но он отвергает гипотезу о том, что ударение является количественно-чувствительным, т. гласные, или биморальные ядра. Делатр (1965) говорит, что хотя в немецком языке в целом наблюдается явная тенденция к словесному начальному ударению, в трехсложных словах частота предпоследнего и предпоследнего лексического ударения статистически не различается.Пятьдесят один процент трехсложных слов имеют предпоследнее ударение, а 49% — предпоследнее ударение. Это показывает, что расположение ударения в немецком языке более вариабельно, чем в испанском и итальянском, что ослабляет способность заметных слогов обозначать либо края языковых единиц, либо последовательно обозначать определенное положение в составных частях. Следовательно, если немцы будут обрабатывать удлинение в новом языке через фильтр фонологии своего родного языка, они с меньшей вероятностью будут интерпретировать удлинение как конечный пограничный маркер фразы, чем как проявление заметности.
Акцентные системы баскского языка сильно различаются в зависимости от географического разнообразия. Ниже мы представляем краткий обзор некоторых важных особенностей, присутствующих в гипускоанских баскских диалектах (географическая диалектная область определена Hualde, 1999). Elordieta и Hualde (2014): 408 говорят, что словесное ударение лексически контрастно только в самом восточном французском регионе Зубероа, за пределами Гипускоа; Во всех областях гипузкоанских диалектов вообще нет контраста в словесной просодии.Обычно слово-второй слог имеет ударение, но иногда ударение может также неконтрастно падать на начальный или последний слог слова даже в той же фразовой среде (Elordieta & Hualde 2014: 463, 440). Кроме того, расположение наиболее заметного слога в слове часто зависит от флективного суффикса, и в некоторых центральных гипускоанских диалектах он может быть привязан к положению слога в фонологической фразе, а не в слове (Hualde, 1999), с удлинение на втором и завершающем фразе слоге.Таким образом, выделение на уровне слов вряд ли может использоваться для определения границ лексических элементов. Однако удлинение в конце фразы может быть гораздо более надежным коррелятом для определения правого края фонологической фразы, поскольку слог в конце фразы получает как фонологическое, так и фонетическое удлинение.
Основываясь на обзоре фонетических и фонологических различий между выбранными языками, мы предполагаем межъязыковые различия в обработке удлинения в родных языках баскского, немецкого, испанского и итальянского языков.Если взрослые слушатели действительно обрабатывают просодические сигналы в романе , незнакомом языке через фильтр своей родной фонологии, мы могли бы ожидать найти кросс-лингвистические различия в использовании удлинения для сегментации нового языка. Поскольку мы используем преднамеренные инструкции и прямо информируем участников о том, что им нужно определять слова воображаемого языка, мы предполагаем, что они прибегают к фонологии на уровне слов при интерпретации удлинения как корреляции известности.Эти предположения позволяют нам строить следующие прогнозы результатов эксперимента. Мы ожидаем, что коренные итальянцы могут выиграть от предпоследнего удлинения, т. Е. Увеличение продолжительности предпоследних слогов в статистических словах должно улучшить производительность сегментации по сравнению с условием без удлинения реплик. В испанском языке известность выравнивается с предпоследним слогом, как в итальянском, и мы ожидаем, что образец исполнения у испанских и итальянских слушателей будет аналогичным, что подтверждает влияние языкового опыта на интерпретацию длительности сигналов в новом языке.Однако облегчающий эффект предпоследнего удлинения на сегментацию нового языка у слушателей-носителей испанского языка может быть меньше, чем у слушателей-носителей итальянского языка, потому что вызванное стрессом удлинение в предпоследней позиции в итальянском языке больше, чем в предпоследней позиции или позиции в конце слова, и это значительно больше, чем в предпоследней позиции на испанском языке. Слушатели-носители немецкого языка с меньшей вероятностью будут воспринимать увеличение продолжительности как заметность на уровне слов, потому что роль продолжительности в проявлении стресса на их родном языке уступает роли флуктуаций F0.Мы ожидаем, что в нашем материале удлинение должно интерпретироваться как резкий пограничный сигнал местными немецкими слушателями, которые, вероятно, воспримут увеличение продолжительности как окончательный сигнал удлинения, а не как коррелят стресса. Ожидается, что слушатели из числа коренных басков будут вести себя больше как слушатели из Германии, то есть получат выгоду, когда последние слоги последовательных составляющих отмечены удлинением. Однако эффект будет слабее, чем для немецких слушателей, из-за сбивающего с толку удлинения второго слога на их родном языке.
Параллельные потоки определяют временную динамику обработки речи в слуховой коре человека
1 Введение
Фундаментальная цель нейробиологии языка — понять, как акустическая информация в речи преобразуется в осмысленное лингвистическое содержание. Считается, что речь последовательно обрабатывается через иерархическую структуру слуховой системы, от акустической до фонематической, до словесных и более высоких представлений (Bizley and Cohen, 2013; DeWitt and Rauschecker, 2012; Leaver and Rauschecker, 2010; Rauschecker and Scott, 2009). ; Wessinger et al., 2001). В результате большинство традиционных подходов были основаны на моделях, обычно исследуя взаимосвязь между четко определенным признаком стимула и нейронной активностью. Например, базовая кохлеарная декомпозиция различных звуковых частот отражается в тонотопически организованных картах, обнаруженных по большей части восходящей слуховой системы, включая первичную слуховую кору и прилегающие области (Da Costa et al., 2013; Kaas and Hackett, 2000). ; Moerel et al., 2012; Saenz, Langers, 2014).Напротив, в слуховой коре более высокого порядка, включая верхнюю височную извилину (STG), есть доказательства кодирования акустико-фонетических характеристик (Howard et al., 2000; Hullett et al., 2016; Mesgarani et al., 2014; Schönwiesner, Zatorre, 2009). Несмотря на то, что эти подходы продуктивны, они часто требуют a priori знаний потенциальных акустических (например, спектрально-временных) или лингвистических (например, фонем, слогов).
Основным ограничением таких основанных на моделях подходов является то, что мы еще не полностью знаем все потенциальные особенности стимула.В лингвистической литературе продолжаются споры относительно роли фонем, слогов и других теоретических когнитивных представлений в нейронной обработке речи (Hickok, 2014; Nearey, 2001; Sussman, 1984). Прогнозирование нейронных реакций по сокращенному набору признаков представляет собой серьезную проблему для характеристики сенсорной коры высокого порядка, где нейронные реакции в большей степени управляются сложными естественными стимулами, чем их составляющими. Действительно, недавние данные свидетельствуют о том, что спектрально-временная модуляция настраивается на речь в STG человека, однако неречевые управляющие стимулы, разработанные специально для исследования функций модуляции, не вызывали сильных реакций (Hullett et al., 2016; Schönwiesner and Zatorre, 2009).
По этим причинам мы использовали беспристрастный, основанный на данных подход, чтобы выявить основные закономерности изменчивости слуховой коры и естественной непрерывной речи. Эта альтернативная, не зависящая от модели стратегия позволила нам идентифицировать типы функциональной реакции участников, не делая предположений о том, какие особенности или параметры речи наиболее актуальны, или даже об их локализации. С этой целью мы изучили массивный набор данных прямых кортикальных записей участников-людей, которым были имплантированы внутричерепные электроды высокой плотности для хирургического лечения эпилепсии.Участники слушали естественные речевые предложения, в то время как записи производились со всего слухового коркового пути, включая сердцевину, пояс и парапоясную слуховую кору, а также связанные префронтальные и моторные области, которые, как известно, участвуют в восприятии речи.
Сначала мы применили неконтролируемую неотрицательную матричную факторизацию (NMF) к профилям нейронных откликов 2100 электродов 27 участников, слушающих естественные предложения. Мы обнаружили два канонических профиля ответа, которые разделили реагирующую на речь кору на пространственно отдельные зоны обработки: каудальная зона, в которой преобладала сильная реакция на начало стимула, и ростральная зона, которая активировалась параллельно и показывала в целом устойчивую активность на протяжении всего стимула.Эти разные профили ответа, наблюдаемые в электродах STG, также наблюдались во всей речевой коры головного мозга, включая ранние слуховые области коры на височной плоскости, а также префронтальные и моторные области. Сегментарные фонетические особенности были представлены локально на отдельных электродах и были одинаково встроены в каждую зону. Вместе эти параллельные потоки определяют поразительную модель временной динамики, которая управляет слуховой обработкой речи.
2 Результаты
2.1 Верхняя височная извилина человека разделена на две зоны с различными профилями реакции на уровне предложений
Участники прослушали 499 естественно произносимых предложений из акустико-фонетического корпуса TIMIT, произнесенных 402 говорящими мужчинами и женщинами. Мы применили алгоритм неконтролируемой мягкой кластеризации, выпуклую неотрицательную матричную факторизацию (cNMF), на записях с 2100 электродов этих пациентов, используя временные ряды с высокой гаммой от всех реагирующих на речь электродов на протяжении всего сеанса записи (см. Методы).Этот анализ был разработан для определения профилей отклика электродов, которые были одинаковыми для всех пациентов, и не полагался на идентификацию какой-либо акустической или фонетической сегментации, а также на знание пространственного положения или анатомической области записей. Наш анализ показал, что два доминирующих профиля отклика характеризуют активность электродов.1). Мы наблюдали разительную разницу в ответах: одна группа показала очень сильную реакцию на начало предложения, а другая, по-видимому, имела ответы, которые были устойчивыми или имели широкие пики в разное время на протяжении предложения. Затем мы исследовали реакцию всей популяции, построив средневзвешенные ответы на отдельные предложения, выровненные по началу предложения и отсортированные по длине (рис. 1b). Поскольку взвешенные по кластерам временные ряды схлопываются по всем электродам в кластере, наблюдается только общая форма активности населения.Таким образом, этот «начальный» и «устойчивый» профиль отклика является общей характеристикой двух популяций электродов.
Хотя наш неконтролируемый анализ был разработан, чтобы выявить сходства в функциональной структуре в разных областях мозга и у разных субъектов, мы также хотели проверить, были ли эти функциональные свойства локализованы в пространстве. Первый кластер, который был чувствителен к началу, был в основном локализован на задней STG, тогда как другой был локализован на передней и средней STG (Рис. 1c).Это пространственное разделение не было требованием нашего алгоритма кластеризации, который выполнялся для всех субъектов одновременно без априорной информации о расположении электродов. Пространственная организация типов ответа была четко видна как в левой ( N = 17 субъектов), так и в правой ( N = 10 субъектов) слуховой коры у всех участников (рис. 1d, также см. Дополнительный рис. 2). В дальнейшем мы будем называть их зоной 1 и 2 по аналогии с разделением в литературе о стволе мозга животных (Cant and Benson, 2007), которое может быть источником восходящей связи с этими корковыми зонами.В дополнение к большому количеству электродов с устойчивым типом ответов в Зоне 2, мы также наблюдали ограниченное количество электродов с устойчивым типом реакции позади Зоны 1, однако это, по-видимому, сильно варьировалось у разных людей.
Мы количественно оценили функциональную и анатомическую силу кластеризации, используя индекс силуэта, который измеряет степень сходства внутри кластера и между кластерами. Индекс силуэта, близкий к 1, указывает на хорошую кластеризацию. Степень функциональной и анатомической кластеризации в зоне 1 и 2 была значительно выше вероятности, что свидетельствует о том, что электроды, принадлежащие каждой группе, были отдельными зонами обработки (рис.1e, p <0,001, ранговые тесты со знаком Вилкоксона).
Эти кластеры представляют собой основной источник расхождений в нашем наборе данных. Подобная кластеризация наблюдалась независимо от метода кластеризации (например, K-среднее и другие методы факторной аналитики показали аналогичные результаты; данные не показаны). По всем предметам два кластера объяснили 14,5% расхождений в данных. Добавление большего количества кластеров объяснило лишь незначительно большую дисперсию (дополнительный рис. 3a). Что еще более важно, внутри дополнительных кластеров мы наблюдали те же самые «начальные» и «устойчивые» типы ответов, которые в основном подразделялись в зависимости от величины ответа (дополнительный рис.3б-г).
На глобальном уровне эти результаты предполагают, что отдельные области STG человека чувствительны к важным временным сигналам в предложениях, таким как начало и продолжение речи. Однако из предыдущей работы мы также знаем, что STG чувствителен к спектрально-временным и фонемным признакам в речи (Hullett et al., 2016; Mesgarani et al., 2014). Чтобы связать эти результаты, мы затем хотели узнать, как обработка в каждой зоне связана с другими акустическими и фонетическими представлениями функций.
Рис. 1. Верхняя височная извилина и средняя височная извилина могут быть разделены на две пространственно-сегрегированные области, показывающие различную временную чувствительность к предложениям.(a) Примеры ответов на предложения от одиночных электродов в первом (красный) и втором (синий) кластерах, окрашенные в соответствии с их весами активации NMF. Форма волны и спектрограмма для каждого предложения показаны вверху. Электроды зоны 1 показали сильную реакцию в начале предложения, иногда за которой следовали реакции с меньшей амплитудой на другие особенности в предложении. Электроды зоны 2 показали разные ответы на протяжении всего предложения и не были сильно избирательными для начала. Начало и смещение предложения отмечены пунктирными линиями.(b) Средний кластерный временной ряд по популяциям Зоны 1 и Зоны 2 показывает, что двумя основными отличительными чертами нейронного ответа являются (1) быстрые ответы с сильной активностью в начале предложения и (2) медленные ответы со слабыми ответами на предложение. начало и более продолжительная активность на протяжении всего предложения. Каждый подзаголовок показывает ответы на все перекрывающиеся предложения по всем предметам, спроецированные на базы NMF и отсортированные по длине предложения. Начало и смещение предложения отмечены пунктирными линиями.(c) Веса активации NMF на электродах от одного примера объекта левого полушария, окрашенных, как в (a). Ответы типа зоны 1 наблюдались в задней части STG вблизи слухового ядра, тогда как ответы зоны 2 были обнаружены ближе к передней части. Обведенные электроды идентифицируют электроды, изображенные на панели (а). (d) Вес активации для всех субъектов в левом и правом полушарии, нанесенный на средний мозг MNI. (e) Оценка степени соответствия функциональной и анатомической кластеризации с использованием индекса силуэта. Индекс силуэта, близкий к 1, указывает на хорошую кластеризацию, при которой расстояния внутри кластера небольшие, а расстояния между кластерами большие.Функционально электроды Зоны 1 и Зоны 2 демонстрируют плотную кластеризацию, которая была значительно выше вероятности (Зона 1: p = 5,4 × 10 −5 , Зона 2: p = 8,3 × 10 −6 , Wilcoxon знаковый ранговый тест). Анатомически электроды зоны 1 расположены близко друг к другу в пространстве и, как правило, далеко от электродов зоны 2, о чем свидетельствует высокий индекс силуэта, который был значительно больше, чем нулевое перемешанное распределение (p = 2,8 × 10 −4 , Знаковый ранговый тест Вилкоксона).Электроды зоны 2 все еще значительно анатомически сгруппированы (p = 7,4 × 10 -3 , знаковый ранговый критерий Вилкоксона), хотя и в меньшей степени, чем электроды зоны 1.
2.2 Акустические представления в зоне 1 и 2
Мы подбираем модели спектрально-временного рецептивного поля (STRF) для каждого электрода отдельно, чтобы определить, какие комбинации спектрально-временных акустических характеристик будут вызывать сильные нейронные отклики из этих областей. Электроды Зоны 1 и Зоны 2 были хорошо описаны этими моделями (средневзвешенное значение NMF: rZone1 = 0.35 и rZone2 = 0,30). Средневзвешенное значение STRF, спроецированных на зоны 1 и 2, показано на рис. 2а. Обе зоны демонстрировали переменную спектральную избирательность (узкая и широкая настройка) и, по-видимому, объединяли звуковую информацию в относительно длительных временных масштабах (до 600 мс для возбуждающей и тормозящей реакции). Однако их временные профили реакции существенно различались. Электроды зоны 1 имели сильное предпочтение к тишине с последующим включением звука, что соответствовало чувствительности начала, которую мы наблюдали на уровне предложения.Возбуждающая часть STRF была непродолжительной, но ей предшествовал относительно длительный тормозной период. Напротив, электроды зоны 2, по-видимому, имели только длительный возбуждающий компонент. На рис. 2b показаны STRF от одиночных электродов в зоне 1 (вверху) и зоне 2 (внизу). Оба показывают избирательность для низких, средних и высоких частот. Некоторые электроды зоны 1 демонстрировали широкополосные неизбирательные начальные реакции, тогда как электроды зоны 2 демонстрировали более сложную спектральную настройку, такую как соседние возбуждающие и тормозящие боковые полосы.
Рис. 2: Электроды зоны 1 — это детекторы начала с избирательностью к быстрым временным модуляциям, присутствующим в речи. Электроды зоны 2 являются более длинными временными интеграторами и нечувствительны к началу речи.(a) Зона 1 (слева) и зона 2 (справа) средневзвешенные спектрально-временные рецептивные поля (STRF). Электроды зоны 1 показывают короткие отклики с задержкой и интегрируются в короткие временные окна, тогда как отклики электродов зоны 2 медленнее и длиннее. Временные отклики, сжатые по частотным характеристикам, показаны вверху, спектральные отклики, сжатые во времени, показаны справа.(b) Пример одноэлектродных STRF в зоне 1 (вверху) и зоне 2 (внизу). В целом электроды для зоны 1 и 2 показали спектральную избирательность в аналогичных диапазонах, но различались по временному профилю отклика. (c) Разница в средней функции передачи модуляции для всех электродов зоны 1 и зоны 2 показывает, что электроды зоны 1 показывают более высокую избирательность временной модуляции, тогда как электроды зоны 2 показывают более высокую избирательность спектральной модуляции для ограниченного диапазона значений модуляции. (d) Согласованные ответы на звуки речи после короткого (<200 мс, слева) и длительного (> 200 мс, справа) молчания.Электроды зоны 1 устойчиво реагируют после долгого молчания, которое может произойти в течение предложения или до его начала. Электроды зоны 2 устойчиво реагируют на речь после короткого и долгого молчания. (e) Задержки начала, пика и смещения отклика, рассчитанные по STRF для зоны 1 и зоны 2. Задержки были значительно выше в Зоне 2 по сравнению с электродами Зоны 1 ( p <0,001, критерий ранжирования знаков Вилкоксона), что указывает на более длительное время интеграции во времени для Зоны 2.
В то время как слуховые области нижнего уровня выполняют частотно-временную декомпозицию входящих звуков. , высшие слуховые нейроны часто чувствительны к более сложным комбинациям характеристик, включая совместные временные и спектральные изменения амплитуды или модуляции (Eggermont, 2001; Shamma, 2001).Понимание речи основано на кодировании относительно узкого набора спектральных и временных модуляций в спектрах всех естественных звуков (Elliott and Theunissen, 2009; Singh and Theunissen, 2003). Чтобы исследовать это кодирование в электродах Зоны 1 и Зоны 2, мы измерили избирательность к совместным спектрально-временным модуляциям, используя функцию передачи модуляции (ФПМ), которая описывает, следуют ли эти электроды изменениям спектрального содержания, временного содержания или того и другого (Singh and Theunissen, 2003 ).В соответствии с предыдущими исследованиями (Hullett et al., 2016; Pasley et al., 2012; Schönwiesner and Zatorre, 2009) мы обнаружили более высокую временную и более низкую избирательность спектральной модуляции в электродах каудальной зоны 1, тогда как электроды ростральной зоны 2 показали низкую временную / высокая избирательность спектральной модуляции (разница MTF показана на рис. 2c). Лучшая временная модуляция была значительно выше в зоне 1 (среднее ± стандартное отклонение 1,5 ± 0,7 Гц) по сравнению с зоной 2 (0,89 ± 0,9 Гц, сравнение p <0,001 критерий суммы рангов Вилкоксона).Наилучшая спектральная модуляция была значительно выше в зоне 2 (0,06 ± 0,2 цикла / октябрь) по сравнению с зоной 1 (0,03 ± 0,1 цикла / октябрь, p <0,001, критерий суммы рангов Вилкоксона). Разница в спектральной модуляции была наиболее сильной для низких спектральных модуляций (<1 цикл / окт.), Которые имеют решающее значение для понимания речи (Elliott and Theunissen, 2009).
Помимо начала предложений, нас интересовало, были ли найдены похожие ответы в предложениях после естественных пауз между фразами.Мы построили выровненные по времени ответы зоны 1 и 2 на речь после короткого (<200 мс) или длительного (> 200 мс) молчания (рис. 2d). Сильные начальные реакции, наблюдаемые в зоне 1, возникали только после более длительных молчаний, что согласуется с указанными выше STRF, тогда как в зоне 2 наблюдались более медленные и устойчивые ответы. Более продолжительное молчание обычно появлялось на границах фраз в естественной речи, и эти результаты предполагают аналогичный профиль ответа, который строго кодирует эти временные ориентиры в речи. Эти начальные реакции наблюдались даже тогда, когда стимулы воспроизводились в обратном направлении или спектрально поворачивались для удаления фонетического и лексического содержания (дополнительный рис.4). Таким образом, хотя, анализируя избирательность модуляции, мы смогли воспроизвести предыдущие данные о представлении высокой временной модуляции в pSTG, наиболее экономным объяснением этих данных, по-видимому, является то, что области зоны 1 являются селективными по началу, а не просто селективными для высоких временных модуляций. Это также объясняет наши предыдущие результаты, согласно которым модулированные пульсирующие шумы со спектральной и временной модуляцией не вызывали сильной активности в STG за пределами начальной реакции (Hullett et al., 2016).
Профили временной интеграции областей мозга могут дать представление о типе кодируемой информации. Чтобы количественно оценить разницу в задержках и временном профиле интеграции в Зоне 1 и 2, мы использовали STRF для каждого электрода, чтобы получить время отклика; мы рассчитали начало, пик и смещение возбуждающего компонента в каждой STRF. Электроды зоны 1 показали более раннюю латентность начала, пика и смещения по сравнению с электродами в зоне 2 (p <0,001, критерий суммы рангов Вилкоксона; рис.2e), но эта разница была наиболее заметной при смещении, где разница в средних задержках смещения составляла 76 мс. Средняя продолжительность возбуждающего ответа составила 139 ± 1 мс в зоне 1 и 196 ± 2 мс в зоне 2. Эти временные характеристики согласуются с предыдущими данными (Honey et al., 2012; Lerner et al., 2011; Nourski et al. al., 2014) и были интерпретированы как свидетельство последовательной обработки внутри «вентрального потока» с идеей, что задние области относятся к низшему порядку. Однако результаты здесь показывают, что представления в разных зонах принципиально различаются, что предполагает более параллельную операцию.Во-первых, многие электроды Зоны 1 неизбирательны в спектральной области, тогда как Зона 2 реагирует на спектрально сложные звуки. Во-вторых, если бы зона 1 была низкоуровневой, она активировалась бы на протяжении всего предложения, а не в первую очередь за счет начала. В-третьих, что наиболее важно, то, как две зоны интегрируют звуковую информацию с течением времени, совершенно по-разному.
В целом, наш акустический анализ показал, что электроды зоны 1 являются детекторами начала с различной спектральной избирательностью и избирательностью быстрой временной модуляции, тогда как электроды зоны 2 являются длительными временными интеграторами, которые нечувствительны к началу и кодируют спектральные модуляции, важные для понимания речи.Затем мы хотели изучить, как эти акустические свойства связаны с представлениями фонем в каждой зоне.
2.3 Встраивание местных фонем в Зону 1 и Зону 2
Фонетические признаки относятся к артикуляционным сигналам в речи, таким как взрывной, носовой, фрикативный и гласный, которые описывают, как звуки, определяющие различные категории фонем, производятся голосовой тракт (Ladefoged, Johnson, 2011). Ранее мы показали, что человеческий STG проявляет избирательность по фонетическим характеристикам (Mesgarani et al., 2014), однако согласованной пространственной карты для этих характеристик у разных испытуемых не обнаружено.
Мы предположили, что взрывные устройства, характеризующиеся тишиной, за которой следует широкополосный всплеск (например, / ba /, / pa / и / ta /), могут выборочно обрабатываться в Зоне 1 из-за их чувствительности к информации временной модуляции. И наоборот, мы предсказали, что Зона 2 будет чувствительна к содержанию спектральной модуляции в гласных. Как и раньше, мы подбираем линейную модель для прогнозирования активности электродов, на этот раз используя сокращенную матрицу двоичных признаков для представления наличия или отсутствия фонетических признаков (гласных, носовых, фрикативных и взрывных) в стимулах предложения (подробности см. В разделе Методы). .Кроме того, мы добавили функцию определения начала каждого предложения, чтобы лучше моделировать начальные реакции, и мы добавили термин «речь против тишины» для моделирования общего увеличения активности во время звуков речи.
Рис. 3: Электроды зоны 1 и зоны 2 демонстрируют перекрывающуюся селективность фонетических признаков.(a) Примеры карт фонетических характеристик для двух субъектов (EC36, слева и EC28, справа). Электроды окрашиваются в соответствии с избирательностью их фонетических признаков (неизбирательный, носовой, гласный, взрывной или фрикативный).Электроды зоны 1 обозначены знаком +, электроды зоны 2 — кружком. SF = сильвиева борозда, STS = верхняя височная борозда, CS = центральная борозда. (b) Распределение селективности фонетического класса аналогично в полях Зоны 1 и Зоны 2 ( p = 0,2, критерий хи-квадрат). Доля сайтов, демонстрирующих избирательность по каждой из пяти фонетических характеристик, показана для сайтов Зоны 1 (темные полосы, слева) и Зоны 2 (светлые полосы, справа). (c) Примеры электродов с аналогичной избирательностью фонетических признаков (вверху: гласные, внизу: взрывные), принадлежащих к классам Зоны 1 (слева) и Зоны 2 (справа).Обратите внимание, что взрыво-селективные электроды часто проявляют избирательность к взрывчатым веществам, за которыми следует гласная. (d) Пример выровненных высокоуровневых гамма-ответов на взрывные фонемы в начале предложения и медиально предложения для электродов, показанных в нижнем левом и правом углу панели (c). Электрод Зоны 1 показывает сильную модуляцию положением фонемы, тогда как электрод Зоны 2 — нет. Поскольку оба набора ответов были оценены по шкале Z относительно средней активности в течение всего эксперимента, взрывные вещества в начале предложения начинаются с базовой линии ниже нуля, тогда как активность, связанная с взрывными веществами в середине предложения, может также содержать ответы на другие фонемы, предшествующие звуку интерес.Кривые показывают среднее значение ± стандартная ошибка по испытаниям. (e) Начальные веса предложений для всех испытуемых, нанесенные в виде тепловой карты на мозг атласа CVS. Положительные веса (указывающие на повышенную реакцию на начало предложения) показаны красным цветом и сильно локализованы в задней части STG как в левом, так и в правом полушарии.
Вопреки нашим ожиданиям, мы наблюдали перекрывающееся представление фонетических признаков в Зоне 1 и Зоне 2, то есть мы не обнаружили разделения согласных и гласных в этих областях.Вместо этого мы нашли доказательства избирательности одного электрода для всех классов фонетических признаков: гласных, носовых, фрикативных и взрывных как в Зоне 1, так и в Зоне 2. Рис. 3a иллюстрирует это разнообразие представления фонетических признаков у двух испытуемых в качестве примера, с Зоной 1. электроды, обозначенные + и электродами зоны 2 в виде кружков. Например, электрод 87 зоны 1 и электрод 150 зоны 2 на панели (а) показывают реакцию на взрывчатые вещества (зеленый). Избирательные электроды «носовой», «щелевой», «взрывной» или «гласный» можно наблюдать как в зоне 1, так и в зоне 2 в левом и правом полушариях.Доля сайтов, настроенных на определенную фонетическую характеристику, существенно не различалась в зоне 1 и 2 (p = 0,2, критерий хи-квадрат; см. Рис. 3b для доли сайтов по всем субъектам, которые продемонстрировали избирательность для каждой функции). Этот неожиданный результат, возможно, согласуется с наблюдением, что время интегрирования STRF по времени было существенно больше, чем длина фонемы (в TIMIT средняя длина помеченной фонемы составляет 80,2 ± 5,8 мс (среднее ± стандартное отклонение), тогда как время интегрирования STRF было намного дольше (в Зоне 2 многие ответы сохранялись почти в течение всего периода задержки STRF 600 мс).
Примеры характерно-временных рецептивных полей для четырех электродов показаны на рис. 3c. Две верхние панели показывают электрод «гласного» зоны 1 и электрод «гласного» зоны 2, тогда как нижние панели показывают «взрывной» электрод зоны 1 и «взрывной» электрод зоны 2 (также показанный на мозге на рис. 3a. ). Интересно, что многие «взрывные» селективные электроды как в зоне 1, так и в зоне 2 были чувствительны к последовательной комбинации взрывной, за которой следовала гласная. В пределах зоны 1 некоторые электроды сильно реагировали на определенные фонетические особенности, с более высокой реакцией в начале предложения (о чем свидетельствуют высокие веса на признаке «начало предложения», см. Рис.3d для необработанных примеров ответов на взрывные звуки в начале предложения и медиально в предложении). Следовательно, избирательность ответа на фонетические признаки кодируется совместно с особенностью начала предложения.
Это сильное различие между предложением-начальным и предложением-медиальным представлением фонем для электродов Зоны 1 было сильно локализовано в пространстве. Электроды с высоким откликом в начале предложения были расположены исключительно в задней части STG (рис. 3e), в отдельной области, в значительной степени перекрывающейся с зоной 1.Вес начала сильно коррелировал с массой NMF зоны 1 (Spearman rho = 0,62) и сильно отрицательно коррелировал с массой NMF зоны 2 (Spearman rho = -0,75). Напротив, мы не нашли доказательств надежной или последовательной пространственной карты избирательности фонетических признаков (дополнительный рис. 5).
В целом, эти результаты демонстрируют, что кодирование фонетических признаков дифференцируется в локальном масштабе отдельных электродов, тогда как временные параметры («начало» против «устойчивое») являются организационным свойством более глобального масштаба, которое разделяет STG.
2.4 Кодирование тонического слога в коре головного мозга Зоны 2
Далее мы хотели лучше понять, какие акустические или лингвистические свойства обрабатывались в Зоне 2. Учитывая более длительную временную интеграцию, мы оценили, были ли электроды Зоны 2 чувствительны к супрасегментарному воздействию. особенности, такие как образцы стресса. В частности, нас интересовала интонационная реплика, называемая «тоническим» слогом, которая обычно приходится на последний ударный слог предложения. Для каждой тональной единицы существует один тонический слог, с которого начинается заключительный просодический контур, такой как повышение высоты звука определенных вопросов или снижение высоты звука, которое передает окончательность повествовательных предложений (Halliday, 1963; Ladefoged and Johnson, 2011).Например, в предложении «Никто не виноват» (рис. 4а) ударение делается как на гласные / ow / в «никто», так и на / a / в «вине», но интонационное значение / a / более важно.
В нашей модели кодирования фонетических характеристик мы отметили ударение как гласного, так и тонического слога в каждом предложении. И в зоне 1, и в зоне 2 кодируется ударение гласных, с большей реакцией на гласные с высоким напряжением (рис. 4b). Однако подмножество электродов Зоны 2 показало заметную реакцию на тонический слог, помимо ответов на ударные слоги (рис.4б). Напротив, электроды Зоны 1 реагировали на тонический слог только как на другой ударный слог, очевидно нечувствительный к интонационному аспекту. Это предполагает, что Зона 2 с ее более длительным периодом временной интеграции и избирательностью для спектральных модуляций также предпочтительно реагирует на просодические особенности в предложении, которые важны для языкового значения.
Пример одного электрода этого типа отклика показан на рис. 4c. Спектрограмма для предложения «Это была ничья вина» снова показана вверху, с контуром амплитуды (сумма спектральной мощности по частотам) розовым цветом и контуром высоты тона F0 синим цветом.Ниже ответ на это предложение показан для электрода, изображенного на рис. 4d (см. Также дополнительный рис. 6). Степень ударения для каждой гласной части слога показана розовым цветом, а более темный розовый цвет означает сильное ударение. Веса индивидуальной регрессии для этого электрода показаны на рис. 4e, с сильной реакцией на слоги с высоким напряжением и дополнительным увеличением активности, если слог был также тоническим слогом. Когда данные подвергались высокочастотной фильтрации, чтобы удалить вклад конверта предложения (см. Методы), базовые функции NMF показали эту сильную модуляцию тоническим слогом для Зоны 2 по сравнению с Зоной 1 (Рис.4е). Зона 2 имела сильное увеличение активности коры головного мозга, привязанной к тоническому слогу (при t = 0) перед смещением предложения, тогда как зона 1 все еще была наиболее отзывчивой в начале предложения.
Поскольку тонический слог определяется с использованием лингвистических критериев, мы оценили, были ли тонические слоговые реакции просто результатом акустических различий по сравнению с другими слогами. По определению, тонический слог не обязательно должен быть самым громким слогом или слогом с наивысшей степенью изменения высоты звука (сильный индикатор интонационного напряжения).Мы вычислили среднюю спектральную мощность как сумму мощностей спектрограммы по всем частотам во время безударных слогов, слогов с низким и высоким напряжением, а также тонического слога. Кроме того, мы вычислили среднее изменение высоты звука во время этих слогов. Тонический слог существенно перекрывается в этих тактах по сравнению с другими типами слогов (рис. 4g), поэтому маловероятно, что эти эффекты вызваны общими акустическими различиями в тонике по сравнению с другими слогами. Вместо этого мы полагаем, что тонический слог является критическим временным ориентиром в непрерывной речи, как полагают лингвисты, чтобы отметить ключевой момент передачи информации в просодическом контуре (Hultzén, 1959).
Рис. 4: Электроды зоны 2 показывают усиленную реакцию на тонический слог, наиболее значимый слог в тональной единице, несущий важную лингвистическую информацию.(a) Пример формы волны предложения (вверху) с комментариями для ударения (P1-P3), тонического слога (T) и контура высоты звука (внизу). Здесь тонический слог, / a / в слове «ошибка», не показывает более высокую амплитуду или более сильный контур высоты тона, а скорее придает предложению его значение и служит наиболее лингвистически важным слогом в предложении.(b) Средние веса регрессии по Зоне 1 (красный) и Зоне 2 (синий) для безударных (P1), с низким (P2) и с высоким (P3) гласных компонентов слога, а также реакции на тонику слог. В целом реакция обоих наборов электродов увеличивается с увеличением нагрузки. Ответы в задней зоне 1 опережают реакции в передней зоне 2. Только в электродах зоны 2 наблюдается усиленная реакция на тонический слог сверх того, что предсказывается только стрессом. (c) Пример реакции одного электрода в Зоне 2 на тонический слог (пунктирная линия) в предложении «Никто не виноват» с ударением, обозначенным как в (a) розовой заливкой.(d) Расположение электрода на панели (c) показано черным контуром на увеличенном масштабе правого полушария мозга пациента. Остальные электроды окрашены в соответствии с их весом в Зоне 1 (красный) и Зоне 2 (синий). CS = центральная борозда, SF = сильвиева борозда, STS = верхняя височная борозда. (e) Веса регрессии для этого электрода. Электрод сильно реагирует на гласные с высоким ударением (P3), но также демонстрирует усиленный ответ на тонический слог (розовый), который может сочетаться с типами слогов P3 и P2. (f) Тонические отклики, выровненные по слогам, проецируются на Зону 1 и Зону 2, фильтруются верхними частотами с частотой 1 Гц, чтобы удалить общие колебания огибающей предложения.Первая пунктирная линия указывает начало предложения; сплошная линия указывает начало тонического слога (t = 0). Электроды зоны 2 показывают сильные синхронизированные по времени ответы на этот слог. (g) Усиленные реакции на тонический слог не могут быть объяснены повышенной громкостью или изменениями высоты тона во время этого слога. Левая панель показывает кумулятивную функцию плотности по средней спектральной мощности (сумма по всем полосам частот в спектрограмме) в пределах каждого типа слога. Тонический слог показал значительно более низкую среднюю спектральную мощность по сравнению с ударными слогами (P2 и P3) и значительно более высокую среднюю спектральную мощность по сравнению с безударными (P1).На правой панели показан график кумулятивной плотности изменения основной частоты (изменение высоты тона) для разных типов слогов. Тонический слог показал среднюю степень изменения высоты звука по сравнению с другими типами слога. Показаны распределения P2 и P3, включая (сплошные линии) и исключая (пунктирные линии) тонический слог, поскольку тонический слог был подмножеством этих категорий.
2.5 Типы ответов зоны 1 и 2 разделяют всю слуховую реагирующую речевую кору
Обнаженный боковой STG является только частью слуховой коры человека и является продолжением слуховой обработки в областях «ядра» и «пояса» височная плоскость (Hackett et al., 2014; Каас и Хакетт, 2000; Moerel et al., 2014). Другие группы успешно использовали электроды для записи глубины в извилине Хешля (HG), чтобы показать, что основные слуховые области коры демонстрируют тонотопическую организацию, быструю латентную реакцию на последовательность щелчков и могут отслеживать изменения высоты звука в чистых тонах (Brugge et al., 2009; Griffiths et al. al., 2010; Howard III et al., 1996; Steinschneider et al., 2014). У четырех участников мы записали одновременно с верхней височной плоскости и боковой поверхности с сетками высокой плотности (расстояние между центрами 4 мм, см. Пример размещения на височной доле для одного пациента на рис.5а) — таким образом покрывая весь слуховой корковый путь. Для этих участников микродиссекция сильвиевой щели была клинически показана для доступа к ограниченным опухолям островка во время краниотомии в бодрствующем состоянии. Это позволило нам временно получить доступ к основной части первичной слуховой коры, включая HG и близлежащие области пояса в planum temporale (PT) и planum polare (PP). Электроды на HG и областях PT устойчиво реагировали на речь (рис. 5b) и чистые тона (рис. 5c). Как и ожидалось, в заднемедиальной части HG мы обнаружили явные доказательства тонотопической прогрессии от низкочастотной к высокочастотной настройке с использованием чистого тона и речевых стимулов.Напротив, реагирующие на речь электроды в STG (электроды нижнего ряда на рис. 5b и 5c) часто были спектрально многопиковыми, широко настроенными или не реагирующими на чистые тона, и поэтому не подходили для решения тонотопии.
При кластеризации NMF, включающей эти электроды, мы обнаружили, что профили реакции зоны 1 и 2, наблюдаемые в STG, дублировались во временной плоскости. Они следовали тому же каудальному / ростральному различию, что и ответы на боковой поверхности STG (рис.5г). Электроды над заднемедиальным HG и PT в основном принадлежали зоне 1, тогда как ростральные электроды PP сильно проецировались на зону 2 (см. Рис. 5e, например, ответы одного электрода на предложения, а также их STRF). Электроды HG и PT показали сильную реакцию начала и короткое время интеграции, тогда как электроды PP показали более медленные ответы, аналогичные ростральным STG. Однако, в отличие от электродов Зоны 1 в STG, электроды Зоны 1 в HG не показывали ответов, ограниченных началом предложения, а вместо этого демонстрировали быстрые, фазовые ответы начала, за которыми следовали дополнительные ответы на особенности во всем предложении.Электроды в PP и рострально-височной плоскости демонстрируют более широкополосную спектральную настройку, в отличие от стереотипных узких, высоко настроенных ответов в сердечнике. Средняя STRF для зон 1 и 2 на временной плоскости (рис. 5f) была очень похожа по внешнему виду на средние STRF для зон 1 и 2 на боковой поверхности (рис. 2a), снова демонстрируя быстрые, избирательные по началу реакции. в Зоне 1 и более длительное временное интегрирование в Зоне 2. Окно временного интегрирования, рассчитанное как разница в смещении STRF и латентных периодах начала, было значительно короче для электродов височной плоскости в Зоне 2 (0.20 ± 0,05 с для височной плоскости, 0,23 ± 0,07 с для STG / MTG, p = 0,03 критерия суммы рангов Вилкоксона) и на уровне тенденции в Зоне 1 (0,15 ± 0,04 с для височной плоскости, 0,16 ± 0,04 STG / MTG, p = 0,14, критерий суммы рангов Вилкоксона), что указывает на медиально-латеральное увеличение временной интеграции в дополнение к вышеупомянутым каудальным и ростральным различиям.
Хотя электроды височной плоскости устойчиво реагировали на речевые особенности, они, как правило, лучше соответствовали спектрально-временной модели, чем модели фонемной характеристики как в зоне 1, так и в зоне 2 (в среднем r спектрально-временная = 0.31 ± 0,18, r признак = 0,29 ± 0,17, p = 7,8 × 10 -9 , знаковый ранговый критерий Вилкоксона). Напротив, модель признаков фонемы превзошла спектральную модель в сайтах STG и MTG r спектрально-временная = 0,28 ± 0,15, r характеристика = 0,30 ± 0,16, p = 1,9 × 10 -66 , Знаковый ранговый критерий Вилкоксона), предполагая, что некоторая акустическая трансформация в фонетическую происходит в боковых областях парапояса, а не во временной плоскости.
Наконец, работа нашей группы (Cheung et al., 2016) и других (Cogan et al., 2014; Wilson et al., 2004) показала реакцию на речь во время пассивного слушания в сенсомоторной коре головного мозга, а также в нижних фронтальных отделах. извилины. При включении этих электродов мы снова обнаружили разделение ответов на зоны 1 и 2 типа ответа (дополнительный рис. 7a). Хотя общая величина кластерных весов в этой области была ниже, чем в классических слуховых областях, профиль отклика для отдельных электродов в этих областях был аналогичным, как и общая структура STRF (дополнительный рис.7б-в). Эти результаты предполагают, что различия между Зоной 1 и Зоной 2 не только применимы к парапоясному STG, но также, по-видимому, являются фундаментальной особенностью организующей реакции всей слуховой речевой коры.
Рис. 5: Зоны 1 и 2 являются организующими элементами всей слуховой иерархии.(a) Реконструкция височной доли для одного пациента с одной сеткой на височной плоскости (синий) и другой на боковой поверхности, включая STG (красный). Пронумерованные электроды на извилине Гешля (HG), височной плоскости (PT) и верхней височной извилине (STG) соответствуют рецептивным полям на (b) и (c).(б) Пример спектрально-временных рецептивных полей (STRF) для электродов височной плоскости и STG. Электроды на HG, PT и STG показали устойчивую реакцию на речь. На сетке височной плоскости мы видели свидетельства тонотопической организации некоторых электродов; такой же организации в СТГ не наблюдалось. (c) Отклики на чистые тона для тех же электродов, что и на (b). HG и PT показали надежные, узко настроенные тональные ответы. STG показал либо широкополосный тональный отклик с высоким порогом (внизу справа), либо отсутствие различимого тонального отклика.(d) Все электроды височной плоскости деформированы и нанесены на мозг MNI (атлас cvs_avg35_inMNI152). Электроды окрашены в соответствии с их весом в Зоне 1 (красный) или Зоне 2 (синий), как на Рисунке 1. Электроды зоны 1 были локализованы в задней височной плоскости, включая PT и HG, тогда как ответы в PP в основном проецировались на Зону 2. . (e) Ответы одним предложением на четыре предложения от электродов, обозначенных в (d), и их соответствующие STRF справа. Электроды зоны 1 в HG и PT показали узкую временную избирательность и сильные ответы в начале предложения, тогда как электроды зоны 2 в PP показали более широкие, более поздние ответы.(f) Средняя STRF для всех электродов Зоны 1 (слева) и Зоны 2 (справа) на височной плоскости. Электроды зоны 1 в этой области также показали характерный ответ, подобный началу, тогда как электроды зоны 2 были длинными временными интеграторами.
2.6 Параллельные потоки кодируют временные ориентиры в непрерывной речевой динамике
Мы определили отдельные пути речевой коры головного мозга, которые, по-видимому, по-разному реагируют на начальные и не начальные компоненты речи и которые интегрируются в краткосрочной и долгосрочной перспективе.Эти наблюдения показывают, что слуховая система очень чувствительна к временной динамике, присущей общей структуре фраз и предложений. Таким образом, чтобы визуализировать, как популяции зоны 1 и 2 вносят вклад во временную динамику естественной обработки речи, мы выполнили корковый анализ пространства состояний (Briggman et al., 2005; Churchland et al., 2012; Kao et al., 2015; Mazor and Laurent, 2005), в котором ответы на предложения проецировались на компоненты NMF. Сначала мы исследовали взаимосвязь между ответами зоны 1 и зоны 2 на всех анатомических участках (рис.6а, см. Также дополнительный рис. 8). Сразу после начала предложения в траектории пространства состояний преобладали ответы Зоны 1, затем переходили к типам ответов Зоны 2. В конечном итоге нейронные траектории сходились в относительно ограниченной области пространства состояний, представляющей тонический слог (розовый) перед концом предложения. Для отдельных предложений траектории через это пространство состояний показывают стереотипный профиль ответа. На рис. 6b слева предложение «Но зачем платить по счетам?» показывает переход в Зону 1 начала, за которой следует коактивация Зоны 2 и дополнительное увеличение активности в Зоне 2 во время тонического слога (/ er / в «her», розовый), за которым следует снижение активности к концу предложения после тонического слога.Справа естественное предложение, содержащее существенную паузу посередине («Тогда он — тогда что?»), Приводит к двум поворотам в этом пространстве состояний («тогда он» в желтых тонах, «тогда что?» В желто-оранжевых тонах. ). Примечательно, что при обозначении положения других фонетических характеристик (например, гласных, фрикативных или взрывных) в этом пространстве состояний фонетические особенности не занимали определенную область глобальной динамики, представленной здесь, а скорее были распределены по траектории предложения. (Инжир.6c – e).
Рисунок 6: Траектории в пространстве состояний для электродов Зоны 1 и Зоны 2 кодируют временные ориентиры в речи.(a) Представление в пространстве состояний для всех электродов ( n = 2100), проецируемых на Зону 1 и Зону 2 во время отдельных предложений. Каждая траектория в пространстве представляет собой одно предложение. Каждое предложение начинается и заканчивается тишиной (выделено серым). Открытый кружок указывает на начало речи, за ним следует цветная линия, которая со временем меняется от светло-желтого до оранжевого в предложении.Тонический слог отмечен на траектории розовым цветом. Смещение предложения отмечено закрашенным кружком. Во всех предложениях нейронная активность следует стереотипному движению через Зону 1, затем коактивируя Зону 2. Тонический слог занимает отдельную область этого коркового пространства состояний, как было замечено в предыдущих анализах, где он сильно проецируется на Зону 2. (b) Единичный. траектории предложения для короткого предложения (слева) и предложения, прерванного короткой паузой (справа). В случае паузы нейронная активность пересекает пространство дважды — по одному разу для каждого сегмента предложения.(c-e) Ответы на фонетические особенности широко распространены в рамках траекторий глобального пространства состояний. Траектории пространства состояний отмечены на наличие гласных (c), фрикативных (d) и взрывных (e), которые, в отличие от тонического слога, занимают несколько областей коркового пространства состояний.
3 Обсуждение
Неконтролируемая кластеризация человеческих корковых ответов на речь выявила две отдельные области, которые были замечательно согласованы у 27 участников. Эти зоны, по-видимому, представляют как низкоуровневые особенности, обнаруживаемые во всей слуховой системе, такие как начала, так и высокоуровневые особенности, которые ранее не наблюдались, такие как тонический слог.Вместе наши результаты демонстрируют потенциальный нейронный код для разграничения времени или положения лингвистически важных событий в естественной речи, тем самым предоставляя контекстную информацию для сегментной фонетической обработки признаков локально в пределах каждого большого региона.
Наша работа выявила два основных типа реакции в Зоне 1 и Зоне 2 с «временной» и «устойчивой» реакцией на предложения. Такие «фазовые» и «тонические» типы ответов наблюдались в единичных электрофизиологических записях по всей слуховой системе, включая слуховую кору височной доли (Eggermont, 2001; Malone et al., 2015; Romanski et al., 1999), слуховой ствол головного мозга (Atencio et al., 2012; Zheng and Escab, 2008) и даже префронтальная кора, где они могут участвовать в принятии решений и идентификации объектов в «вентральном потоке» (Bizley and Cohen, 2013; Romanski, Goldman-Rakic, 2002; Romanski et al., 1999; Tsunada et al., 2016). Предыдущие исследования, однако, четко не задокументировали пространственную сегрегацию этих типов ответов в слуховой коре. В результате было неожиданно обнаружить, что такие различия в ответах могут быть последовательно регионализированы на макроанатомическом уровне.Насколько нам известно, только ограниченные данные фМРТ предполагают преходящие и устойчивые корковые реакции у людей (Harms and Melcher, 2003; Seifritz et al., 2002; Werner and Noppeney, 2011), хотя эти ответы были в гораздо более длительных временных масштабах (секунды и минуты) , в основном ограниченный временной плоскостью и в контексте синтетических стимулов или шума сканера, а не естественной речи.
Многие предыдущие исследования, включая наше собственное, могли упустить эти свойства в поисках более канонических акустических и речевых характеристик, таких как фонемы и слоги, в STG человека.Здесь подход, основанный на данных, в сочетании с крупномасштабным охватом, плотной выборкой и записями ЭКоГ в реальном времени внесли непосредственный вклад в наблюдаемую здесь новую функциональную кластеризацию. Конечно, подход, основанный на моделях, обнаружил бы четкие нейронные корреляты с началом предложения и тоническими слогами, если бы их искали.
Несмотря на ограниченные предыдущие демонстрации функциональной организации, существуют существенные анатомические доказательства для дифференциации каудальной и ростральной слуховой коры (Kaas and Hackett, 1999, 2000; Rauschecker and Scott, 2009; Rauschecker et al., 1997; Romanski et al., 1999). Мы называем наши каудальные и ростральные области Зоной 1 и Зоной 2, соответственно, после анатомических исследований, показывающих параллельные топографические проекции от нижнего бугорка до медиального коленчатого тела (Cant and Benson, 2007). Эти потоки, по-видимому, сохраняются вплоть до первичных слуховых, поясных и парапоясных областей и могут быть частью путей «где» (каудальный) и «что» (ростральный), описанных у нечеловеческих приматов (Bizley and Cohen, 2013; Kaas, Hackett, 1999; Rauschecker, 2012; Romanski et al., 1999). Наши результаты из височной плоскости и латеральной STG подтверждают исследования связности у нечеловеческих приматов, которые постулируют два измерения слуховой обработки вдоль медиально-латеральной и каудально-ростральной осей, соответственно (Hackett, 2011). Кроме того, core и planum temporale (включая каудальный парапояс) отличаются тяжелыми паттернами корковой миелинизации (Dick et al., 2012; Glasser and Van Essen, 2011; Hackett et al., 2001), что, вероятно, поддерживает быстрое временная обработка в этих областях.Что касается модели «дорсального» и «вентрального» потока (Hickok and Poeppel, 2007), мы считаем, что это отдельное различие. По нашим данным, отдельные респондеры Зоны 1 и Зоны 2 были обнаружены в областях вентрального потока STG и MTG. Участки дорсального потока (например, моторная кора, надмаргинальная извилина) также могут загружаться как зона 1 или зона 2, но обычно менее сильно, чем в вентральных областях.
Наши результаты показывают, что это разделение является фундаментальным аспектом организации слуховой коры и, вероятно, не специфично для обработки речи (Steinschneider et al., 2013). Тем не менее, эти основные свойства отклика имеют значение для определения времени важных с лингвистической точки зрения событий. Основным новым открытием настоящего исследования является то, что «тонический слог» (Halliday, 1963) в лингвистической просодии вызывает сильный избирательный отклик от подмножества электродов Зоны 2, что согласуется с их близостью к известным областям обработки звука (т.е. «Питч-центр» (Бендор и Ван, 2005)). Чувствительность к началу может играть решающую роль в разборе границ предложений и фраз с использованием акустических сигналов в сочетании с другими синтаксическими сигналами высокого уровня (Ding et al., 2015). Детекторы начала, наблюдаемые в Зоне 1, могут иметь решающее значение для анализа слуховой сцены (Bregman, 1994), поскольку спектральная энергия от отдельных источников обычно когерентна во времени (O’Sullivan et al., 2015; Shamma et al., 2011). Мы наблюдали очень мало ответов на смещения по сравнению с началом, в соответствии с нейрофизиологическими и поведенческими доказательствами того, что звуковым началам придается больший перцепционный вес (Phillips et al., 2002).
Здесь мы описали главное подразделение всей слуховой корковой системы, которое поддерживает несколько уровней спектрально-временных, фонологических и лингвистических представлений.Это определяющее свойство слуховой корковой организации предполагает, как нейронные популяции динамически объединяются для поддержки восприятия речи, и, вероятно, отражает общий механизм обработки естественных звуков. Хотя эти результаты демонстрируют извлечение множества измерений акустико-фонетических и временных сигналов в речи, главная проблема состоит в том, чтобы понять, как такая информация полностью интегрируется на более высоких корковых уровнях для поддержки понимания языка.
4 метода
4.1 Участник
Участниками были 27 пациентов (13M / 14F, возраст: 36 ± 12 лет) с имплантированными субдуральными внутричерепными сетками электродов высокой плотности (AdTech или Integra, 256 каналов, расстояние между центрами 4 мм и диаметр 1,17 мм) либо хронически в рамках их клинической оценки для хирургического лечения эпилепсии или в острых интраоперационных условиях для удаления опухоли. Все процедуры были одобрены Институтом надзора Калифорнийского университета в Сан-Франциско, и все пациенты предоставили информированное письменное согласие на участие.17 испытуемым были имплантированы решетки левого полушария, а 10 испытуемым — решетки правого полушария. Подробная информация об имплантации (полушарие, пол, руки, доминирование языка и фокус припадка) приведены в дополнительной таблице 1. У 4 пациентов с опухолями, потребовавшими рассечения сильвиевой щели и обнажения височной плоскости, мы также получили нейронные записи непосредственно из во временной плоскости с использованием 32-канальной (8 x 4) или 64-канальной (8 x 8) сеток с характеристиками, аналогичными боковым сеткам (Integra, межцентровое расстояние 4 мм и 1.Диаметр 17 мм). Для этих пациентов записи были получены одновременно с височной плоскости и боковой поверхности мозга (включая STG / MTG).
4.2 Нейронные записи
Электрофизиологические записи были получены с частотой дискретизации 3051,8 Гц с использованием 256-канального усилителя PZ2 или 512-канального усилителя PZ5, подключенного к цифровой системе сбора данных RZ2 (Tucker-Davis Technologies, Алачуа, Флорида, США) . Мы записали потенциал локального поля от каждого электрода, отфильтровали сигнал с частотой 60 Гц и гармониками (120 Гц и 180 Гц), чтобы уменьшить артефакты, связанные с линейным шумом, и повторно сослались на общее среднее значение по каналам, использующим один и тот же разъем, чтобы предусилитель (Cheung et al., 2016). Затем мы использовали логарифмическую амплитуду преобразования Гильберта для полосовых сигналов в высоком гамма-диапазоне (70-150 Гц), используя 8 логарифмически разнесенных центральных частотных полос и взяв первый главный компонент в этих полосах для извлечения нейронных связей, связанных со стимулом. активности (Edwards et al., 2009; Moses et al., 2016; Ray, Maunsell, 2011). Затем сигналы с высоким уровнем гамма-излучения были субдискретизированы до 100 Гц для дальнейшего анализа. Сигналы были оценены по z-шкале относительно среднего и стандартного отклонения активности в течение каждого сеанса записи.
4.3 Удаление кортикальной поверхности и визуализация электродов
Мы локализовали электроды на головном мозге каждого человека путем совместной регистрации предоперационной МРТ T1 с послеоперационной компьютерной томографией, содержащей расположение электродов, с использованием нормализованной процедуры взаимной информации в SPM12. Для интраоперационных пациентов, которым не было доступно компьютерной томографии (4 пациента), локализацию электродов выполняли вручную с использованием интраоперационных фотографий размещения сетки. Реконструкции пиальной поверхности были созданы с помощью Freesurfer.Для визуализации координат электродов в пространстве MNI мы выполнили регистрацию нелинейной поверхности с использованием сферического выравнивания на основе борозды в Freesurfer, выравнивая по шаблону cvs_avg35_inMNI152 (Fischl et al., 1999). Это нелинейное выравнивание гарантирует, что электроды на извилине в естественном пространстве субъекта остаются на той же извилине в пространстве атласа, но не поддерживает геометрию сетки.
4,4 стимула
предложений TIMIT . Речевые стимулы представляли собой 499 предложений, взятых из акустико-фонетического корпуса TIMIT (Garofolo et al., 1993), на котором говорят 286 мужчин и 116 женщин из разных регионов Соединенных Штатов Америки. Большинство предложений повторяются 1-2 раза; для большинства пациентов (23/27) подмножество из 10 предложений повторялось 10-22 раза. Стимулы воспроизводились через динамики со свободным полем (Logitech), а презентация контролировалась с помощью специального программного обеспечения MATLAB на ноутбуке с Windows. Предложения предъявлялись в псевдослучайном порядке с перерывом в 0,4 секунды между каждым.
Чистый тональный стимул .Для испытуемых с охватом временной плоскости мы также воспроизводили чистые тональные стимулы, синтезированные как тоны синусоидальной волны с косинусоидальным накатом длительностью 50 мс и 5 мс с разнесенными на мелкие промежутки центральными частотами, которые совпадали с нашими спектрограммами предложений. Эти центральные частоты находились в диапазоне от 74,5 Гц до 8 кГц. Чистые тона воспроизводились с 3 уровнями интенсивности с интервалом 10 дБ, при этом самая низкая интенсивность была откалибрована так, чтобы ее можно было минимально слышать в больничной палате. Каждая пара чистого тона частота / интенсивность повторялась 3 раза, а интервалы между стимулами колебались (диапазон 0.Минимальный ISI 28 с, максимальный ISI 0,5 с).
4.5 Выбор электродов
Мы идентифицировали электроды с устойчивой реакцией на звуки речи с помощью t-теста начальной загрузки. Для каждого электрода мы сравнивали случайные 1-секундные фрагменты нейронных данных во время речевых стимулов с 1-секундными фрагментами во время тишины для 10 000 итераций начальной загрузки (с заменой). На каждой итерации мы вычисляли среднюю разницу в активности для речи и молчания, а затем рассчитывали значение p начальной загрузки как среднее количество раз, когда эта разница в активности была больше нуля.Затем мы выбрали электроды со значительным откликом на речь при пороге p <0,001. В результате у 27 пациентов было установлено 2100 реагирующих на речь электродов.
4.6 Мягкая кластеризация данных временных рядов с использованием выпуклой неотрицательной матричной факторизации
Мы использовали выпуклую неотрицательную матричную факторизацию (cNMF) (Ding et al., 2010), чтобы выявить функциональные области на основе коррелированной активности во время прослушивания естественной речи задача. Вкратце, мы оценили временной ряд X [n точек времени x p электродов] со следующей факторизацией: где F = XW .
Матрица G [ p электродов × k кластеров] представляет пространственный вес электрода в данном кластере, а матрица W [ p электродов × k кластеров] представляет веса для каждого из электрод временного ряда. Ограничение F как выпуклой комбинации временных рядов электродов позволяет нам вычислить «центроид» временных рядов, то есть взвешенный временной ряд XW для каждого кластера k даст нам прототипные временные ряды для этого кластера (см. (Ding et al. al., 2010) для доказательства этой концепции и рис. 1б для кластерных временных рядов).
Мы объединили временные ряды с z-оценкой для всех 27 субъектов и выполнили кластерный анализ для всех субъектов одновременно, чтобы найти закономерности активности, которые были согласованы для всех субъектов. Мы ограничили этот анализ предложениями, которые слышали все испытуемые, которые включали в общей сложности 319 предложений. Мы инициализировали матрицу W, выполнив сначала разложение по собственным значениям на единично-нормированной ковариационной матрице X T X с последующим вращением и исправлением варимакса.Затем матрица G была инициализирована согласно Ding et al. 2008 (Ding et al., 2008), с последующим чередованием обновлений W и G , как описано у Ding et al. 2010 (Ding et al., 2010) до достижения конвергенции.
Чтобы оценить количество кластеров, мы вычислили процентное отклонение, объясненное при проецировании данных на вычисленные кластеры NMF. Для этого мы использовали следующее уравнение:
Затем мы построили график дополнительной процентной дисперсии, объясненной для k = 2 до k = 32 кластеров.
4.7 Силуэтный индекс
Для оценки разделимости кластеров мы использовали силуэтный индекс s ( i ), который описывает, насколько хорошо каждый электрод i соответствует своему собственному кластеру по сравнению с несоответствующим кластером. Это принимает форму: где d на ( i ) — наименьшее среднее несходство электрода i с кластером, для которого он не является членом (измеряется квадратом евклидова расстояния), а d в пределах ( i ) — среднее различие электрода i со всеми остальными электродами в том же кластере.Индекс силуэта рассчитывался отдельно для каждого испытуемого. Для функциональной кластеризации мы рассчитали несходство как квадрат евклидова расстояния между весами активации NMF G для каждого кластера. Для анатомической кластеризации несходство рассчитывалось с использованием физического попарного расстояния между электродами внутри или между кластерами.
4.8 Анализ траектории
Анализ траектории в пространстве состояний был выполнен путем проецирования данных со всех электродов на базовые функции NMF.Это эквивалентно вычислению «центроида» F временного ряда кластера, описанному выше. Для Зоны 1 это был взвешенный временной ряд XW 1 , где использовался только первый столбец W, а для Зоны 2 это был взвешенный временной ряд XW 2 , только со вторым столбцом из Вт . Для анализов, которые были ограничены субъектом, мы использовали только столбцы X и строки W , соответствующие электродам в пределах интересующего объекта, и вычислили XW для этих подмножеств электродов.
4.9 Спектрально-временная и характерно-временная оценка рецептивного поля
Для моделирования акустических и фонетических преобразований в первичных и непервичных областях мы использовали модели линейного кодирования, чтобы описать высокую гамма-активность, зарегистрированную на каждом электроде, как взвешенную сумму характеристик стимула на протяжении время. Эта модель известна в литературе как спектрально-временное рецептивное поле и широко используется для описания избирательности к естественным стимулам (Theunissen et al., 2001). Модели имели вид:
Где x — нейронная активность, зарегистрированная на одном электроде, β ( τ , f ) содержит веса регрессии для каждого признака f при временном лаге τ , а S — представление стимула. .Мы оценили модели, используя два представления данных: (1) представление на основе спектрограммы и (2) представление на основе признаков фонем. Для представления спектрально-временного стимула мы использовали спектрограмму mel-диапазона, как и в нашей предыдущей работе (Mesgarani et al., 2014). Частоты диапазона mel находились в диапазоне приблизительно от 75 Гц до 8 кГц, с использованием банка слуховых фильтров с косинусным преобразованием, которое дает представление спектральной мощности во времени, имитирующее фильтрацию, выполняемую слуховой системой человека (Slaney, 1998).
Для представления признаков фонем мы построили бинарную матрицу признаков фонем, описывающую каждое предложение как набор признаков (1 для наличия признака и 0 для его отсутствия), описывающих фонетический или другой лингвистический контент. Основываясь на предыдущей работе, показывающей, что STG реагирует на фонетические особенности, а не на отдельные фонемы (Mesgarani et al., 2014), мы свернули транскрипцию фонем из TIMIT в фонетические функции, включая звонкие и глухие фрикативы, звонкие и глухие взрывные, жидкости / носовые / скользит, и гласные.Гласные были разделены ударением, определенным на трех уровнях (P1 = безударное, P2 = среднее напряжение, P3 = высокое напряжение). Чтобы смоделировать общие колебания огибающей амплитуды, мы включили функцию для речи и тишины. Чтобы смоделировать нелинейность ответа в начале предложения и после пауз, мы также включили функцию начала предложения, чтобы отметить первую фонему каждого предложения, а также функции, отмечающие конец длинных пауз (> 200 мс) или коротких пауз (<200 РС). Наконец, тонический слог был взят в качестве последнего полнотекстового слога предложения (Halliday, 1963; Ladefoged and Johnson, 2011).Последний ударный слог типичного английского предложения или фразы имеет особое просодическое значение (Kingdon, 1958; Palmer, 1922; Wells, 2006), например, он начинает конечный контур (Hockett, 1958), включая знаменитый всплеск множества вопросов ( Батлер, 1634), и составляет пик передачи информации (Hultzén, 1959) в просодической фразе. Это всегда было в пределах одного слова содержания (в отличие от функциональных слов), и лишь изредка (<≈ 10 предложений) ручная идентификация тонического слога отличалась.Это были случаи, когда из-за ударения в предложении более ранний ударный слог, возможно, был равен или больше по просодической значимости, чем последний ударный слог. Однако лингвисты расходятся во мнениях относительно того, должен ли слог с ударением в предложении обязательно считаться тоническим слогом, и мы отмечаем, что ударение в предложении определенно не является явлением по принципу «все или ничего». Таким образом, определение тонического слога путем прослушивания ударения в предложении обязательно будет очень субъективным и трудоемким. Поскольку речь шла только о нескольких предложениях, которые не повлияли на результаты, было сочтено, что лучше придерживаться простого тонического слога, основанного на правилах (т.е., последний слог предложения с полным ударением), который может применяться автоматически и легко воспроизводиться в лабораториях.
Мы подбираем рецептивные поля, используя временные задержки до 600 мс, чтобы учесть более длительные ответы, наблюдаемые в переднем STG. β весов были подобраны с использованием гребневой регрессии, где параметр гребня оценивался с помощью процедуры начальной загрузки, в которой обучающая выборка была случайным образом разделена на наборы для 80% предсказания и 20% тестовых наборов гребня. Параметр гребня был выбран в качестве параметра, обеспечивающего наилучшие средние характеристики электродов, оцененные по корреляции между прогнозируемыми характеристиками и характеристиками набора для испытаний гребня.Окончательные характеристики модели были рассчитаны на окончательном удерживаемом наборе, не включенном в выбор параметров гребня. Производительность измерялась как корреляция между предсказанным ответом модели и фактической высокой гаммой, измеренной для предложений в тестовой выборке.
4.10 Анализ передаточной функции модуляции
Мы рассчитали передаточную функцию модуляции (MTF) каждой STRF как двумерное преобразование Фурье STRF (Singh and Theunissen, 2003). После выполнения двумерного преобразования Фурье значения возводились в квадрат, логарифмически преобразовывались и умножались на 10 для преобразования единиц в мощность (дБ).Затем были совместно выбраны наилучшая временная модуляция и наилучшая спектральная модуляция путем определения пика матрицы MTF, как описано ранее (Hullett et al., 2016).
4.11 Анализ задержки ответа
Чтобы вычислить задержки ответа из STRF, мы вычислили временное ядро, взяв среднее значение по всем частотам в матрице STRF. Мы рассчитали задержку начала как время, в которое производная временного ядра достигла своего максимума. Пиковая задержка была пиком этого временного ядра, а задержка смещения была временем после пика, при котором производная временного ядра была максимально отрицательной.
4.12 Статистические тесты
Для данных, которые отклонялись от нормальности, мы использовали непараметрическую сумму рангов Вилкоксона (для непарных данных) или знаковые ранговые тесты (для парных данных). В некоторых случаях использовался t-тест начальной загрузки.
Петр, предшественник в фонетическом алфавите / SAT 5-23-20 / Тимор член ООН с 2002 года / Gitano Испанский язык Хит для Бейонсе и Алихандро Фернанандес / Имя, производное от греческого языка для святого / Имя в начальной школе Спрингфилда
Конструктор: Вина Лю и Эрик Агард
Относительная сложность: средняя (8-иш + ошибка-поиск-гласная-в-иностранном слове!)
ТЕМА: нет Слово дня: Тир ( 40A: Названо в честь скандинавского бога войны: Аббр.=> ВТ. ) —
Týr (; [1] Древнескандинавский: Týr , произносится как [tyːr]), Tíw (древнеанглийский) и Ziu (древневерхненемецкий) — бог в германской мифологии. Происходя от протогерманского божества * Tīwaz и, в конечном итоге, от главного протоиндоевропейского божества * Dyeus , мало информации о боге сохранилось за пределами древнескандинавских источников. Из-за этимологии имени бога и призрачного присутствия бога в сохранившемся германском корпусе некоторые ученые предполагают, что Тир, возможно, когда-то занимал более центральное место среди божеств раннегерманской мифологии.Тыр — тезка руны Тиваз (ᛏ), буквы рунического алфавита, соответствующей латинской букве T . Согласно процессу германской интерпретации , божество является тезкой вторника («дня Тира») на германских языках, включая английский. Interpretatio romana , в котором римляне интерпретировали других богов как свои собственные формы, обычно представляет бога как Mars , древнеримского бога войны, и именно через эту призму происходит большинство латинских упоминаний бога.[…] Современное английское название дня недели Tuesday означает «Tíw’s day», имея в виду древнеанглийское расширение божества. Вторник происходит от древнеанглийского tisdæi (до 1200 г.), который развивается из более раннего tywesdæi (1122), который, в свою очередь, происходит от древнеанглийского Tīwesdæg (до 1050 г.). У этого слова есть родственные слова во многих других германских языках, включая древнескандинавский týsdagr , фризский tīesdi , древневерхненемецкий zīostag , средневерхненемецкий zīestac и алеманнский zīstac .Все эти формы происходят от прото-германского названия дня недели, означающего «день Тиваза», что само по себе является результатом немецкой интерпретации латинского dies Martis (что означает «день Марса»). Это свидетельствует о раннем германском отождествлении Тиваза с Марсом.
• • •
Действительно красивая сетка. Я боролся с некоторыми подсказками, которые временами казались мне слишком умными для собственного блага, то есть настолько умными, что я все еще не был уверен, что правильно понял их после того, как получил ответ.Супер «вдумчивые» подсказки — это один из способов добавить сложности к головоломке, но они действительно должны приземлиться для меня, иначе я буду раздражен. Возьмите O’ER (31D: снова сокращено) , который я не мог получить, кроме как через кресты, и только после того, как все это было на месте, я увидел «о … так что это« сокращенная »форма слово, которое означает «снова» … ну, хорошо, «что, как вы могли догадаться, несколько менее возбуждающе, чем» вау «или» ага! » И подсказка по поводу LEGAL LIMIT все еще немного озадачивает меня, когда речь идет о грамматике ( 8D: обязано следовать ).Существительное здесь? И я должен «следовать» в смысле «соблюдать» или «подчиняться»? Кто я в этом сценарии? В каком контексте? На самом деле вы бы не сказали, что должны «следовать» ЮРИДИЧЕСКОМУ ОГРАНИЧЕНИЮ . Формулировка действительно сомнительна, и все для того, чтобы вы могли получить эффект «ха-ха, вы думаете, что это глагольная фраза, но это именная фраза». Опять же, если вы попробуете этот трюк (проверенный временем трюк, который теоретически вполне подходит), убедитесь, что он * приземлился *. Не большой поклонник «мы усложнили дело, сделав подсказки до абсурда неудобными.«Тем не менее, этого было не так уж и много. Это очень шикарная сетка с множеством блестящих разговорных фраз (« РОДЖЕР, КОТОРЫЙ »,« ЭТО НЕ ГОНКА »,« ПРОВЕРИТЬ, ПОЖАЛУЙСТА, СДЕЛАНО ЭТО СТРАННО » и т. д.), и хотя у меня было несколько неудачных опытов с подсказками, мои доминирующие чувства были положительными.
[«Они называют это мгновенным правосудием, когда оно превышает ЮРИДИЧЕСКИЙ ПРЕДЕЛ …»]
Мне посчастливилось дойти до самого конца и получить два плохих квадрата — один — ошибка, другой — гигантский вопросительный знак.Давайте сначала рассмотрим ошибку — я был супер-психован, чтобы узнать ответ на вопрос 36A: Festival, который отмечается с 31 октября по 2 ноября сразу же. Я был гораздо менее взволнован, чтобы правильно написать первое слово в ответе. Я написал в DI O DE LOS MUERTOS, потому что, не будучи испаноговорящим, я путаю в голове род слов, поэтому DIA кажется мне женским, но он действительно мужской, и, к сожалению, сегодня это означало, что мой мозг просто решил сделать это слово более маскулиновым, убрав букву «А» и заменив ее буквой «О» (пожалуйста, не просите логики у меня в голове, она редко меня обязывает).Это означало, что у меня были ЗАКРЫТЫЕ ЛОПАТЫ в 3D: Узкие побеги (ЗАКРЫТЬ БРИТЬЯ) , и хотя я определенно прищурился на это, я подумал, что это какое-то разговорное выражение, о котором я просто не знал (я бы использовал «близкий вызов» миллион раз, прежде чем я использовал «гладкое бритье», поэтому, хотя я знаю фразу «гладкое бритье», она просто не кричала на меня). Затем был переход MILL / LESTE . Что ж, LESTE … каждая буква — предположение. Никогда об этом не слышал. Тимор, да, Восточный Тимор, точно Тимор- , ЛЕСТЕ , ура.Мне удалось сделать -ESTE, но MILL … вы не могли бы написать худшую подсказку * для меня * для MILL , если бы вы попробовали ( 28A: Machine shop Essential ). Я не совсем уверен даже в том, что такое «механический цех». Я понимаю, что это промышленность, и люди используют машины, чтобы делать … вещи … для … промышленности? Но для меня MILL — это то место, где вы измельчаете зерно. Или перец. Или, может быть, вы рубите бревна на пиломатериалы. Идея «механического цеха» « MILL ing» мне совершенно чужда.Поэтому я написал там букву «L» только потому, что буквально все остальное не имело смысла. И поэтому из-за проблем с иностранными гласными и перехода между неясным топонимом и чем-то выходящим из рулевой рубки я почти не закончил. Уф. Это был очень близкий рывок.
Есть ли парадигматический КАЛЕ САЛАТ ? ( 6A: блюдо, часто с начинкой из козьего сыра и клюквы ) У меня их было много, и я ем их дома достаточно регулярно, но козий сыр и клюква? То есть, я могу положить их в любой салат, но.