argon bulletin board

Експертно търсене  

Новини:

Регистрирането на нови потребители е временно деактивирано.

Автор Тема: изчислителна лингвистика  (Прочетена 23689 пъти)

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
Re: изчислителна лингвистика
« Отговор #100 -: 31.05.2006, 23:17:47 »

Здравей НепъленЧлен,

В говоримия език е ясно защо. Не съм сигурен доколко вестниците използват език, който е лишен от пълния член. Ако това наистина е така, то в писмения български ще се използва все по-рядко обратният словоред (вероятно само в случаи в които субектът и обектът могат да бъдат определени от значението на думите без многозначност, с цел да се постави акцент върху обекта).

Нещо, което може да се направи по въпроса е българските учени (тези, които много са учили) да преброят в корпус от български вестници дали пълният член отпада или не и да информират любопитната общественост, да кажем, в патриотичен репортаж по канал 1 ;)

Пълният член не може да отпадне веднага. Нужно е време - вероятно години, ако изобщо има такава тенденция. Дали има такава тенденция, аз не знам, за сега.

поздрави:
Атанас Чанев
докторант по Когнитивни Науки
Университет в Тренто
ITC-irst Пово-Тренто
Активен

artanis

  • Неактивен Неактивен
  • Публикации: 589
    • http://free.hit.bg/artanis
Re: изчислителна лингвистика
« Отговор #101 -: 14.07.2006, 00:39:06 »

Здравейте,

Тази тема много прилича на монолог (или блог), но се надявам да е интересна за някои.

Проблемът е dependency parsing. Това е, когато структурата на изречението на някакъв език се представя като наредена двойка от думи, като първата дума е родител на втората дума. Напр.

Аз обичам кафява захар.
(обичам, Аз) - това е субект
(захар, кафява) - това е атрибут
(обичам, захар) - това е обект

Много интересна е задачата за статистически dependency parsing, където тези двойки думи се научават от текстове, които са анотирани от хора, а после алгоритъм за парсинг построява структурата на изречението.

Любимите ми алгоритми за dependency парсинг са:
Shift-reduce (Nivre)
Chu-Liu-Edmonds (ясно кой)
Eisner (на основата на CYK)
Earley (Lesmo) - този не е статистически. Доколкото знам, няма статистически Earley за  dependency parsing

поздрави:
Атанас Чанев
в момента в Масачусетски Институт по Технологии
Активен