Anton Kazennikov (kzn) wrote,
Anton Kazennikov
kzn

Category:

The Allen AI Science Challenge и Deephack.QA

Ходил сегодня послушать, что делали наши команды в The Allen AI Science Challenge.
Все команды использовали примерно одинаковый набор техник: сначала индексировали разными способами коллекции документов в lucene, потом искали в построенных индексах пары вопрос - ответ (по нескольким индексам) и как-то сливали вместе полученный результат.
Кто-то строил индексы на википедии, кто-то на материалах ck12, кто-то еще нашел учебники, и проиндексировал их. Ну и индексы также строились на различных представлениях: отдельных статьях, параграфах и предложениях.

Занятно, что во-первых "наш" хакатон был вроде как по deep learning, а в итоге его никто не использовал (или использовали без особого эффекта вследствие малого объема данных), а во-вторых все докладчики использовали IR-style подход, в котором лингвистика практически полностью игнорируется.
Subscribe

  • ...

    Умер qkowlew. Светлая память.

  • Немного о топонимике [России]

    Занимаюсь задачкой автоматической нормализации адресов. На первый взгляд - все просто. Есть справочник налоговой инспекции, ФИАС, в котором…

  • (no subject)

    На днях купил родителям новую DECT-трубку. Раньше считалось, что хорошо кроме радиотрубки иметь еще и обычный стационарый телефон. Если вдруг в доме…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments