TechSparks
46.1K subscribers
503 photos
142 videos
19 files
5K links
Аннотированные ссылки на интересные, полезные и удивительные новости хайтека.
Кто больше любит слушать длинное чем читать короткое http://sebrant.chat
https://knd.gov.ru/license?id=6777b11d506f967728ac580d&registryType=bloggersPermission
Автор: @asebrant
Download Telegram
Не очень увлекательная по форме, но интереснейшая по существу (как часто бывает с  научными публикациями) работа, посвященная алгоритмическому детектированию сарказма в твитах. Задачка кажется тяжелой, ибо сильно завязана на психологию восприятия, и чисто лингвистическим путем вряд ли решаема. Вот это авторы и учли: кроме свойств самого твита в обучающей выборке (причем саркастическими считались те, которые явно тегированы #sarcasm, т.е. автор явно имел в виду съехидничать), среди факторов были свойства автора, свойства аудитории - и даже свойства обмена твитами, в рамках которого постился саркастический твит. И в итоге получилось неплохо: алгоритм сумел предсказывать саркастичность твитов с вероятностью почти 85%. По моим ощущениям, и люди-то не всегда с такой точностью отлавливают сарказм в словах других. Так что теперь ждем детектирования юмора и на следующем шаге алгоритмическую генерацию шуток ;)
http://www.aaai.org/ocs/index.php/ICWSM/ICWSM15/paper/view/10538/10445