You are viewing kzn

Anton Kazennikov's Journal
 
[Most Recent Entries] [Calendar View] [Friends]

Below are the 20 most recent journal entries recorded in Anton Kazennikov's LiveJournal:

    [ << Previous 20 ]
    Monday, October 14th, 2013
    14 Oct 2013 | 23:32
    На тему дня.
    Стало интересно посмотреть результаты выборов мэра в сентябре этого года в Бирюлево. Вот они:


    Район

    Собянин

    Навальный
    Бирюлево Западное 64,24% 18,58%
    Бирюлево Восточное 58,91% 20,9%
    Monday, August 26th, 2013
    26 Aug 2013 | 11:37
    Использование минимальных ацикличных автоматов для представления словарей
    Я наконец-то написал на хабр пост про то, как представлять словари в виде минимальных ацикличных автоматов:
    http://habrahabr.ru/post/190694/
    Monday, May 6th, 2013
    06 May 2013 | 11:34
    Java7 & regexp
    Java местами очень поражает. Вот в JDK7 в регулярках появились именованные группы. Очень полезная фича, на мой взгляд, поскольку можно извлекать данные без привязки к порядку групп. Реализуется тоже очень просто. Надо всего лишь сохранять отображение name -> groupNumber, что в общем-то и сделано.

    Все круто, но как определить, какие группы в некотором шаблоне есть? А никак. Есть Pattern::namedGroups(), но он имеет default visiblity, и так просто не вызвать.
    Monday, December 31st, 2012
    31 Dec 2012 | 18:10
    Итоги 2012
    Ну что ж. Год был трудный.
    События:

    • Успел позаниматься сисадминством и вебдевом
    • Ушел из ИППИ РАН - перестал быть МНСом
    • Теперь работаю в Айкумене
    • Работал последние пару лет без отпуска
    • Поучаствовал в митингах, но быстро разачаровался
    Thursday, September 20th, 2012
    20 Sep 2012 | 9:39
    "Дневник преподавателя-взяточника"
    Начал читать "Дневник преподавателя-взяточника" Данилевского. Того, которого обвиняют в убийстве двух человек в Казани.

    Сам роман о теневом бизнесе в вузе. Ну там как покупаются экзамены, как поступают за деньги.
    Пока читается довольно интересно и легко. И если автор сгущает краски, то не очень сильно.
    Т.е. каких-то принципиальных сенсаций нет. Элементы этого бизнеса есть скорее всего практически во всех вузах в той или иной степени.

    В целом познавательно.
    Friday, September 14th, 2012
    14 Sep 2012 | 21:18
    Цикл популярных лекций по компьютерной лингвистике в Лектории Политехнического музея
    Originally posted by kzn at Цикл популярных лекций по компьютерной лингвистике в Лектории Политехнического музея
    Пришло по мослингу:

    Институт лингвистики РГГУ совместно с Лекторием Политехнического музея рады
    объявить о начале третьего цикла популярных лекций по лингвистике. Тема
    этого сезона - <<*Компьютерная лингвистика*>>.

    Программа цикла ниже в письме, с аннотациями лекций можно ознакомиться на сайте Института лингвистики РГГУ.

    Мы будем очень признательны за распространение информации о цикле.

    С уважением,
    Антон Сомин.

    *Компьютерная лингвистика существует уже полвека, но только теперь её
    плодами готовы пользоваться миллиарды. Задачи автоматического анализа
    текста, такие как машинный перевод, распознавание речи, информационный
    поиск стали актуальными с момента появления компьютера, но только
    технологическая революция, связавшая нашу жизнь с интернетом и
    многочисленными мобильными коммуникационными устройствами, сформировала
    всеобщую потребность в языковых технологиях. Готова ли компьютерная
    лингвистика к этому вызову?*

    *В третьем цикле лекций, организованном Институтом лингвистики РГГУ и
    Политехническим музеем, о задачах компьютерной лингвистики расскажут те,
    кто уже достиг серьёзных успехов в их решении: представители
    исследовательских и коммерческих проектов в области автоматической
    обработки естественного языка.*

    *Лекции проходят с октября по декабрь по вторникам в 19:00 в Лектории
    Политехнического музея (Политехнический музей, Новая Площадь 3/4, 9-й
    подъезд, ст.м. <<Лубянка>>, <<Китай-город>>). Стоимость билета - 200 р.
    (полный)/100 р. (льготный).**
    *
    *Расписание цикла* (аннотации лекций см. на сайте Института лингвистики
    РГГУ: http://il.rsuh.ru/section.html?id=9800)

    9 октября. *Владимир Селегей*. Компьютерная лингвистика сегодня: от
    автоматической обработки текста до машинного понимания
    16 октября. *Андрей Плахов*. Cистемы поиска в Интернете: как обрабатывается
    запрос пользователя
    23 октября. *Екатерина Рахилина*. Национальный корпус русского языка: новые
    компьютерные ресурсы для лингвистов и нелингвистов
    30 октября. *Екатерина Фроловичева, Артём Семенихин*. IBM Watson: может ли
    компьютер отвечать на вопросы лучше человека
    6 ноября. *Сергей Шаров*. Компьютерный анализ жанра и характеристик автора
    текста
    13 ноября. *Леонид Иомдин*. Машинный перевод: успехи, неудачи, надежды
    20 ноября. *Владимир Беликов*. Компьютерный анализ блогосферы как источник
    знаний о языке
    27 ноября. *Владимир Хорошевский*. Компьютерная лингвистика и семантическая
    паутина Интернета: откуда и куда мы идём
    4 декабря. *Борис Иомдин*. Компьютерная лексикография: как компьютер
    помогает делать словари
    Thursday, May 17th, 2012
    17 May 2012 | 13:11
    TWIMC: я в Питере 25.05 - 27.05
    Я еду в Питер на AINL.

    Буду с пятницы вечера(25го) до середины воскресенья(27го).
    Thursday, April 19th, 2012
    19 Apr 2012 | 12:00
    Прекрасное

    • Стабильная работа, заработная плата без задержек (зависит от квалификации);

    Отсюда
    Tuesday, April 10th, 2012
    10 Apr 2012 | 12:48
    Ашманов про новости


    Ашманова всегда интересно послушать. Можно не быть с ним согласным, но мне кажется, что важным анализ и реакция не только на непосредственно новости, но и общей картины.

    Очевидно, что тема манипулятивна. В частности, Ашманов так нигде не определил, что считать новостным сюжетом. Скажем банально "сюжет" про патриарха можно считать одним большим сюжетом, а можно считать как много маленьких сюжетов.
    Friday, December 9th, 2011
    09 Dec 2011 | 10:35
    Информация к размышлению



    В целом я себя считаю либералом. Но мне не очень приятно смотреть на эти выступления, несмотря на то, что в целом и к Навальному, и к Шендеровичу я отношусь хорошо.

    Мне эти выступления не нравятся следующим:
    1. Это выступление "несистемной оппозиции". При всем моем уважении к, либеральная оппозиция поддеживается узкой группой населения в 5-10%.
    2. Тезис о том, что ЕР никем не поддерживается - ложь. Да, у ЕР очевидно нет поддержки 50% населения, но как минимум 25-30% у нее есть.
    3. 25-30% - это где-то результат КПРФ. Врядли можно говорить о том, что КПРФ не пользуется поддержкой.
    4. Мне кажется не очень разумным поддерживать (а фактически быть винтиком) у просто хорошего человека. В конце концов результатом поддержки хороших людей был развал СССР в той форме, в которой он произошел.
    Thursday, December 8th, 2011
    08 Dec 2011 | 14:18
    Политическое: 632305222316434
    Я долго думал писать ли что-нибудь о прошедших выборах или нет.

    Больше всего меня возмущает то, что меня (как избирателя) считают дураком. Я вполне верю, что ЕР набрала 30-35%, и что они являются первыми. Но мне кажется странным скачкообразные изменения результатов ЕР по округам. Порядок цифр примерно такой: 35, 58, 60, 36, ~43.

    Мне кажется, что или власти насколько наглы или некомпетентны, что делают вот так открыто - ведь скорее всего можно сделать так, чтобы цифры были более правдоподобными с сохранением текущего баланса сил. Скажем ну набрала бы ЕР в Мск и СПб по 25-30%, в итоге у нее было бы не 49, а 42-45 наверное. Что бы это сейчас изменило?

    Или это сделано специально - я не очень понимаю причину, ведь это противоречит утверждению о стабильности.

    Лично для меня проблема в другом. В доверии. Если жульничают здесь, то что межает жульничать в другом?

    И да, поучаствую в флешмобе, просто для статистики.

    Чтоб два раза не вставать сообщу еще об одной волнующей меня проблеме. Если кратко, то
    парк куда родители ходят гулять с собакой сначала передали академии ФСБ, а затем она передала его некой компании "МонАрх" в счет достройки нового корпуса академии. Итого парк находится под угрозой застройки.
    Thursday, August 25th, 2011
    25 Aug 2011 | 12:15
    Удивительное рядом
    Теперь я знаю, как можно довольно легко получить данные с банковских карт и пин коды. Достаточно просто устроиться кассиром на какую-нибудь заправку.

    Неоднократно видел ситуацию, когда клиент расплачивается карточкой, а кассир просит назвать пин код - он не может протянуть терминал к клиенту из-за мер безопасности. И клиент при этом спокойно называет нужные циферки.
    Thursday, July 7th, 2011
    07 Jul 2011 | 20:54
    Как [просто] получить OutOfMemoryError
    Очень легко получается, если последовательно обрабатывать много больших текстов. Схема такая:

    1. Получить текст
    2. Вырезать нужный кусок с помощью s.substring()
    3. ????
    4. PROFIT!

    А все потому, что для оптимизации .substring() не создает новую строку, а использует существующую.
    Все это тривиально решается с помощью new String(s.substring())
    Tuesday, May 24th, 2011
    24 May 2011 | 21:36
    Диалог-2011
    Если вдруг кто-нибудь едет на Диалог, то я там буду во второй половине пятницы и первой половине субботы. На этот раз правда не в качестве докладчика, а в качестве вольного слушателя.
    Можно встретиться :-)
    Wednesday, April 20th, 2011
    20 Apr 2011 | 11:02
    Tuesday, March 29th, 2011
    29 Mar 2011 | 22:45
    Monday, November 29th, 2010
    29 Nov 2010 | 14:36
    Wikipedia XML dump
    В Wikimedia работают весьма неспешные люди.
    У них упала машина с дампами, выглядит все это так:

    • 11-10-2010 - New errors
      Yesterday the web server hung on the box; the error was this. Raid errors on trying to bring the host back up. Rob's talking to SM again and we're also deciding what new box to order.

    • 12-Nov-2010
      We are still in the process of getting an RMA for the backplane from the vendor.
    • 15 Nov 2010
      The vendor will be shipping out a new backplane today; it should arrive before
    • 10 am tomorrow. We expect to install it tomorrow if it arrives on time, otherwise Wednesday.
    • 16 Nov 2010
      The part was shipped 3 day; apparently that's what the warranty we have provides for. This means it is due to arrive on the 18th by late afternoon. We hope to have it installed then or early on the 19th.
    • 22 Nov 2010
      The part arrived Friday, it was installed, upon bootup we saw bogus errors about the number of disks. The vendor tells us this is a firmware issue. Apparently their firmware updates require windows on the *server* (which is not possible for us) so we are working on getting a new part shipped out asap with the current firmware.
    • 24 Nov 2010
      The part arrived, Rich installed it, upon bootup we saw the same errors. The vendor has been emailed and voicemail left also. Their offices seem to be closed right now and for Thurs/Fri, due to the holiday. We are trying to see if we can get someone to contact us sooner than that.

      We got a response, they recommended booting off a USB key in order to run a utility, can't seem to get to that point in the BIOS due to the raid errors. Discussion ongoing with the vendor.


    Отсюда
    Sunday, November 14th, 2010
    14 Nov 2010 | 18:47
    НЕНАВИЖУ
    Интересно, кто учит людей писать вот такой код:
    int temp = fCurrentPosition;
    try {
    	int result;
    	fCurrentCharacter = fSource[fCurrentPosition++];
    	if (fCurrentCharacter == testedChar1)
    		result = 0;
    	else if (fCurrentCharacter == testedChar2)
    		result = 1;
    	else {
    		fCurrentPosition = temp;
    		return -1;
    	}
    	return result;
    } catch (IndexOutOfBoundsException e) {
    	fCurrentPosition = temp;
    	return -1;
    }
    



    А потом жалуются, что java тормозит.
    Thursday, September 30th, 2010
    30 Sep 2010 | 14:37
    Занятная цитата из блога Alex Smola
    Scientific papers sometimes obscure simple ideas. In the most extreme case, a paper will get rejected if the idea is presented in too simple terms (it happened to me more than once and the paper was praised once the simple parts had been obfuscated). Also, they need to come with ample evidence for why an idea works, strong theoretical guarantees and lots of experiments. This is all needed as a safeguard and it’s really really important. But it often hides the basic idea.
    Alex Smola
    Thursday, September 16th, 2010
    16 Sep 2010 | 13:35
    misc
    Сходил на семинар в Яндекс на "Towards a Distributed Search Engine" Ricardo Baeza-Yates. В очередной раз почувствовал, что знаю я очень мало. Такое чувство у меня часто возникает, когда читаешь научные статьи. Кто-то придумал, реализовал, получил результаты. А тебе надо как минимум несколько дней для того, чтобы разобраться как это работает.

    Заметил забавную тенденцию - большинство зарубежных докладчиков используют MacBook. И им часто необходима помощь в настройке вывода на проектор. С одной стороны это ожидаемо от докладчиков на гуманитарные темы, но немного странно от технарей. С другой - что важно далеко не знание передовых технологий. И что обычно большинство известных в программерской тусовке людей стало известными не благодаря реализации чего-то, а идеям или определенной позиции.

    В этом смысле программирование похоже на анекдот "Что тут думать? Тут прыгать надо!" Такое отношение вызывают у меня различные холивары вроде C++ vs. Java, C# vs. Java, функциональщики vs. императивщики и т.д. Я часто читаю доводы сторон, но в основном это откладывание более важных проблем.
[ << Previous 20 ]
About LiveJournal.com