alkalinin's Journal
[Most Recent Entries]
[Calendar View]
[Friends]
Below are the 20 most recent journal entries recorded in
alkalinin's LiveJournal:
[ << Previous 20 ]
| Wednesday, November 25th, 2009 | | 9:44 am |
Noscript В приступе паранойи поставил себе в FireFox плагин NoScript, контроллирующий выполнение js-кода на веб-страницах. Думал, что он у меня не продержится и недели, однако его использование параною только усилило. Сколько же всякого хлама грузится! Вот к примеру, Яндекс грузит js-код не только с yandex.ru, но и с yandex.net и, почему-то, с yandex.st. На разных сайтах регулярно грузится рекламный js-код с каких-то непонятных ip-адресов. В общем, NoScript у меня прижился. Автоматический кросс-пост из моего блога. | | Saturday, November 7th, 2009 | | 7:30 am |
Как улучшить качество
Читаю Speech and Language Processing, к одной из глав приведён замечательный эпиграф: Anytime a linguist leaves the group the recognition rate goes up.
Fred Jelinek (head of the IBM speech group) (1988)
Так же к этому эпиграфу прилагается небольшой комментарий: In an address to the first Workshop on the Evaluation of Natural Language Processing Systems, December 7, 1988. While this workshop is described in Palmer and Finin (1990), the quote was not written down; some participants remember a more snappy version:
Every time I fire a linguist the performanve of the recognizer improves.
Между прочим это подтвержает известное мнение, что в компьютерной лингвистике собственно лингвистики должно быть как можно меньше, от неё вред один. Сразу же вспоминается как Алексей Байтин во время доклада про работу опечаточника в Яндексе шутил, что на этот раз он довёл это утверждение до логического конца и в опечаточнике теперь никакой лингвистики нет, сплошная статистика. Автоматический кросс-пост из моего блога.
| | Monday, November 2nd, 2009 | | 9:34 am |
Резкое обострение
Сегодня, пока ехал на работу, наблюдал как минимум 4-х жертв мозговируса свиного гриппа: в повязках, отрешённо глядящих куда-то мимо соседей. Ещё на прошлой неделе такого не было, что случилось-то? Автоматический кросс-пост из моего блога.
| | Thursday, October 29th, 2009 | | 11:43 am |
Бренд Грипп А/H1N1
Обнаружил у Коммерсанта на сайте выделение объектов из текста в виде отдельного блока «В статье», где перечисляются персоны, организации, бренды и регионы, упомянутые в документе. При этом в статье «Свиная кормушка» про свиной грипп список брендов начинается с «Грипп А/H1N1». И ведь не поспоришь. Автоматический кросс-пост из моего блога.
| | Tuesday, October 27th, 2009 | | 2:29 pm |
Сколько программистов нужно, чтобы вкрутить ламопчку?
Сегодня проверяли опытным путём, сколько программистов нужно, чтобы вкрутить лампочку. Я надеялся, что при правильном руководстве хватит и одного, однако правильный ответ иной: понадобится столько программистов, сколько их есть в комнате, включая случайно зашедшего системного администратора. Потому что вкручивание лампочки это очень увлекательный процесс, в котором каждый хочет поучаствовать. Автоматический кросс-пост из моего блога.
| | Wednesday, October 21st, 2009 | | 1:04 pm |
Кто хочет, своего добьётся
Всё-таки, интересно устроены мозги у правозащитников. Иногда читаешь и думаешь: какие логические цепочки вызывают те или иные утверждения? Вчера в Коммерсанте была опубликована статья, «СФ добивается отсрочки от армии», о том что 18-летним в весенний призыв могут предоставлять однократную отсрочку для поступления в институт. Анонс статьи выглядит так: Вчера в Совете федерации прозвучала инициатива о внесении поправок в законодательство, которые закрепляют отсрочку от призыва в армию для поступающих в вузы. Правда, такую возможность выпускники школ могут получить лишь однажды, в весеннюю призывную кампанию. Норма может заработать уже в 2010 году, однако, как выяснил "Ъ", в Минобороны и Госдуму подобные поправки не поступали. В Союзе комитетов солдатских матерей в них не видят смысла.
Кто-нибудь может сразу угадать, почему в Союзе комитетов солдатских матерей не видят в этом смысла? Ведь, казалось бы, они должны быть довольны? А правильный ответ следующий: Однако в союзе не видят в поправках особого смысла. "Кто хочет учиться, и сейчас может "заболеть", дождаться окончания весеннего призыва, а потом поступить в вуз",-- пояснила госпожа Мельникова,
И правда, зачем нужен честный путь, когда всегда можно добиться своего обманом? Какой, однако, достойный человек госпожа Мельникова. Автоматический кросс-пост из моего блога.
| | Sunday, October 18th, 2009 | | 2:48 pm |
RuSSIR'2009
Сентябрь провёл в разъездах. В частности, побывал в Петрозаводске, на летней (осенней?) школе по информационному поиску RuSSIR'2009. Впечатления сугубо положительные, в этом году школа оказалась лучше, чем в 2008. Особенно был хорош курс «Modeling Web Searcher Behavior and Interactions», ради него одного стоило туда поехать. Так же было интересно послушать «Enterprise and Desktop search», а «Information Retrieval Modeling» оказался очень продуманным вводным курсом, вполне вероятно я из него что-нибудь позаимствую для своего курса по информационному поиску в МАИ. Впрочем, не всё было ровно. Курс «Computational advertising: business models, technologies and issues», из-за которого я и поехал на RuSSIR во второй раз, был унылым, лектор зачем-то решил вместо собственно вычислительной рекламы рассказать про теорию оптимизации, снабдив свои лекции совершенно безумным количеством слайдов (в книге со всеми слайдами его курс занял больше половины имеющегося места). Ну и «Linguistic Semantics for Search Precision and Recall Improvement» не впечатлил. Но вообще, было здорово. Автоматический кросс-пост из моего блога.
| | Tuesday, September 15th, 2009 | | 6:36 pm |
Смайлик
Читал третий том Кнута, вдруг в глаза бросился смайлик. Испытал от этого сильнейший культурный шок. Оказалось, это переводчик вставил прямо в текст свой комментарий и снабдил его смайликом, вот так: (программистам на C/C++: не примите случайно это число (071) за восьмеричную запись числа 57. :-) -- Прим. перев.)
Надмозги, да? Автоматический кросс-пост из моего блога.
| | Saturday, September 12th, 2009 | | 1:02 pm |
Welcome to real life
Лёша Вознюк пишетВсе-таки следует признать, что один жирный минус в CL существует: практически нет библиотек приемлемого качества. Не, с количеством проблем никаких, но большинство пакаджей тупо уровня контрольной работы школоты, или вообще в формате "proof of concept". На мой взгляд, это не минус, а логичное следствие всех тех «плюсов», которые выделяют любители Лиспа. Ведь что они говорят? Не надо задумываться о мелочах, сначала описывайте верхний уровень, а всё, что понадобится ниже, доделаете по ходу: это помогает, с одной стороны, сосредоточиться на проблеме и, с другой стороны, даёт возможность привнести громадную гибкость в код. При этом почему-то заранее предполагается, что времени и желания хватит на то, чтобы всё сделать. А что будет, если, к примеру, времени нет, или через неделю задачей заниматься уже неинтересно? Остаётся некий варез, спроектированный на самом верхнем уровне, но внизу либо не написанный вовсе, либо состоящий из сплошных заглушек. Ну, то есть, proof of concept. А прозаичным доведением дела до конца, по мнению авторов, займутся другие люди, это же ведь магия opensource. Автоматический кросс-пост из моего блога.
| | 8:22 am |
День программиста
Все ведь уже слышали, да? У программистов России официально появился профессиональный праздник — 256-й день в году, а, точнее, уже завтра: 13-е сентября в невискосоный год. Ура, товарищи. Автоматический кросс-пост из моего блога. | | Sunday, September 6th, 2009 | | 8:12 am |
И всё у них так
В журнале КоммерсантЪ-Власть опубликован отрывок из книги Касьянова и Киселёва, касающийся Ходорковского. На мой взгляд, текст по своему характеру повторяет все худшие автобиографические и либеральные опусы. Автобиографичность произведения, конечно, подразумевает что центральной фигурой становится автор, но когда получается что-то в духе Гашековских денщиков, при чтении срывает крышу: В настоящее время денщики рассеяны по всей нашей республике и рассказывают о своих геройских подвигах. Они-де штурмовали Сокаль, Дубно, Ниш, Пиаву. Каждый из них -- Наполеон. «Вот я и говорю нашему полковнику: пусть, мол, позвонит в штаб, что можно начинать» А либеральность сказывается в том, что если читать текст бегло, то возникает ощущение продуманности суждений: всё пишется с уверенностью в своих словах, как будто всё очевидно и поневоле соглашаешься с автором, следишь за его мыслью вплоть до какого-то пункта, в котором написан такой очевидный бред, что сразу же появляются сомнения в здоровье автора. Вот, например, он пишет о предложении Ходорковского зафиксировать результаты приватизации, т.е. с одной стороны признать её несправедливость, но, с другой стороны, успокоить новых собственников, гарантировать им, что всё, нажитое «непосильным» трудом, теперь им принадлежит навечно (а они за это немножко «отстегнут»): -- А как же вы собирались определить размер компенсации, которую должен был выплатить каждый из участников приватизации?
-- Вот тут у Ходорковского была такая просьба: не спускать из правительства никаких формул и разнарядок. Он говорил: «Мы сами лучше всех знаем, сколько в свое время недоплатили государству. Среди нас, участников приватизации, есть общее понимание, кто сколько должен внести. Кто-то $1,5 млрд, кто-то $3 млрд, кто-то $5 млрд. Мы сами между собой договоримся». Мне эта мысль показалась здравой. В итоге Ходорковский ушел от меня с намерением подготовить проект этого закона. Буквально через неделю проект был готов. Очень краткий, на двух страничках, простой и ясный.
С точки зрения Ходорковского и иже с ним, это очень, очень выгодное предложение. Т.е., нам государство ещё раз сделает реверанс, а мы за это заплатим, но сколько заплатим -- мы тут сами решим, нечего нам мешать. С чего вдруг, люди, получившие выгоду от несправедливости в момент приватизации, смогут справедливо определить сколько они недоплатили -- совершенно непонятно. И, конечно, «простой и ясный» проект аж на двух страничках. Да до двух предложений нужно было сократить, чего столько многабукфф писать?! Непонятно только одно: зачем это нужно было бы государству? Получить немного денег, а в обмен за это подтвердить наличие в стране олигархического строя? И что случилось бы дальше? И вот всё у них так. Вообще, этот отрывок чётко показывает громадное либеральное самомнение, непоколебимую уверенность в том, что «свои» всегда правы, потому что они же все свои, либералы, в костюмах и очках, умные и хорошо образованные, а к чему все эти договорённости и правила между умными людьми? Они же либералы, всё что они делают, направленно на благо человечества по определению, а вот все эти формулы и разнарядки исключительно бюрократия. Отсюда и главное либерально-демократическое противоречие: с одной стороны, все равны и счастье для всех, а с другой стороны — быдло, «только в этой стране», призывы НАТО бомбить Москву и всё прочее, окрывающее путь к фашизму, как к квинтэссенции практического либерализма. Автоматический кросс-пост из моего блога. | | Wednesday, September 2nd, 2009 | | 12:12 pm |
Путин в википедии
Читал статью про Путина в википедии, много удивлялся. А как начал читать обсуждение этой статьи, всё прояснилось. Вот, к примеру: - С одной стороны предлагают:
Так и быть, давайте статью чистить. На первый раз предлагаю удалить следующие фрагменты (так как из них самих не следует, что они имеют какое-то отношение к Путину) (это про взрывы домов в 99-м году)
- Но, с другой стороны, знающие люди отвечают:
это по приказу путина эти дома были зорваны
Ну и дальше в том же духе. Интересно, как англоязычная Википедия справилась со всем бедламом? Или не справилась, а это просто не так заметно, как в русской её части? Автоматический кросс-пост из моего блога. | | Thursday, August 13th, 2009 | | 7:47 pm |
AirFrance
Если на русском сайте Air France попытаться заказать билеты, то в окончательных тарифах может быть указано такое: Бортовое питание : еда
Даже боюсь предположить, какие могут быть варианты у этого пункта. Автоматический кросс-пост из моего блога.
| | Tuesday, August 4th, 2009 | | 11:53 am |
Математическая психология
У Станисла Лема в «В Вовзращении со звёзд» было: - Вы хотите изучать психологию? - удивилась она.
- Нет, но я хочу знать, что вы сделали за это время...
- Я бы вам посоветовала Майссена... - сказала она.
- Что это такое?
- Школьный учебник.
- Я бы предпочел что-нибудь более серьезное. Справочники, монографии... лучше всего получать из первых рук...
- Это, вероятно, будет слишком... трудно... Она снисходительно улыбнулась.
- А может быть, и нет. В чем состоит трудность?
- Психология очень математизировалась...
Помню, меня очень позабавила возможность «математизирования» психологии. Однако, не успел толком начаться 21-й век, как это уже стало реальностью: в книге The Mathematics of Marriage: Dynamic Nonlinear Models Джон Готтмэн и соавторы строят математические модели исходя из анализа коротких диалогов между супругами и на основании этого могут оценить перспективы брака, вероятность развода и т.п. Собственно, книгу я ещё не прочитал, только чуть-чуть полистал. Мысль одна: «с ума сойти!» Автоматический кросс-пост из моего блога.
| | Tuesday, July 21st, 2009 | | 3:08 pm |
Содержимое-тип
В интернете как: если долго-долго думать и придумать какую-нибудь совершенно невозможную ошибку, то рано или поздно можно обнаружить сайт, где эта ошибка есть. Вот, например, заголовки сайта forum.samsung-fun.ru, которые я получил только что через lwp-request: Cache-Control: private, pre-check=0, post-check=0, max-age=0
Connection: keep-alive
Date: Tue, 21 Jul 2009 08:33:52 GMT
Server: nginx/0.3.27
Content-Type: text/html; charset=windows-1251
Expires: Tue, 21 Jul 2009 08:33:52 GMT
Last-Modified: Tue, 21 Jul 2009 08:33:52 GMT
Client-Date: Tue, 21 Jul 2009 08:33:54 GMT
Client-Peer: 93.191.15.73:80
Client-Response-Num: 1
Client-Transfer-Encoding: chunked
Content-Style-Type: text/css
Keep-Alive: timeout=20
Link: ; rel="shortcut icon"; type="image/x-icon"
Link: <templates subsilver="" style.css="">; rel="stylesheet"; type="text/css"
Link: </templates>; rel="alternate"; title="RSS Forum"; type="application/rss+xml"
Set-Cookie: sams_fun_data=a%3A0%3A%7B%7D; expires=Wednesday, 21-Jul-10 08:33:52 GMT; path=/
Set-Cookie: sams_fun_sid=5d374f68aac8862fb9aab8b77f05e151; path=/
Title: Главная :: Samsung-Fun.ru
X-Meta-Description: Главная - Samsung-Fun.ru
X-Powered-By: PHP/4.4.9
Содержимое-Тип: text/html; charset=windows-1251
Содержимое-Тип! Странно, что они остальное не перевели. Автоматический кросс-пост из моего блога.
| | Tuesday, July 14th, 2009 | | 8:41 pm |
Не стоит изучать историю по блогам...
... пишу я в своём блоге по мотивам поста Сергея Петренко про историческую достоверность, где он сделал аналогичный вывод про советских публицистов, обидившись на них из-за слов Юлиана Семёнова про «столетия дисциплины при кайзерах», в то время как Сергей насчитал только лишь 47 лет. И ладно бы Сергей остановился на своей внимательности, но ведь он дальше начал открывать читателям правду о том, как всё было на самом деле. Самое удивительное открытие, на мой взгляд, вот это: Скорбите о жертвах Второй мировой? Так не забывайте, что вторым государством, чьи войска атаковали границу буржуазной Польши, был СССР и эта агрессия была поминутно согласована с планами Германии.
Поминутно! Следует вспомнить, что Германия вошла в Польшу 1-го сентября (что и считается началом второй мировой), а советские войска пересекли польскую границу 17-го сентября. Как можно поминутно согласовать операцию, которая началась спустя 17 дней? Понятно, что Германия постоянно напоминала советскому руководству о том, что неплохо бы войти в Польшу, но получала отказ вплоть до 16-го сентября, пока Молотов не ответил что «военная интервенция Советского Союза произойдёт, вероятно, завтра или послезавтра». К тому моменту польская армия уже была практически разгромлена, а немцы стояли под Варшавой. Если считать масштаб ошибки, то Юлиан Семёнов ошибся в 4 раза (столетий может быть минимум два), а вот числа Сергея Петренко отличаются от реальных в 2880 раз (столько минут в двух сутках). Если же серьёзно, то меня давно уже смущал этот термин: вторая мировая война. Что такое, «мировая война»? Кто и каким образом отличает обычную войну от мировой? Почему, к примеру, то что творилось в Европе до 1-го сентября ещё не было второй мировой, а вот после -- вдруг ей оказалось? И только примерно год назад я нашёл ясный и очевидный ответ на этот вопрос, хотя и несколько для себя неожиданный. Мировая война это такая война, в которой участвуют просвещённые страны, т.е. на тот момент Англия, Франция и Германия. Пока Англия не воевала -- никакой мировой войны не было, что вы. Был абсолютный мир и полное спокойствие. А то что происходило с Чехословакией, Австрией -- это всё были мелочи. Собственно, и вторжение в Польшу просвещённые державы тоже бы спустили на тормозах, если бы Гитлер сделал главное, ради чего его и пестовали: атаковал бы Советский Союз. Это видно по странным манёврам войск союзников после объявления войны. Где они были, что они делали? Как они спасали Польшу? Но Германия вместо ожидаемого хода развернула войну в Европе, а, значит, всё-таки наступила мировая война. И тогда понятно почему для Советского Союза и России этот термин не значит практически ничего: он чужой, непонятный, потому что с СССР в этой войне никто не воевал. В общем-то, это справедливо: в свой мир просвещённые и цивилизованные страны СССР не пускали. Автоматический кросс-пост из моего блога. | | Thursday, July 9th, 2009 | | 1:51 pm |
Длина слова
В любых задачах, связанных с обработкой текстов на естественном языке, так или иначе возникает проблема: какой максимальной длины может быть слово? Ответ тут такой: если для небольшой коллекции документов этот лимит может быть посчитан, то для постоянно разрастающегося и потенциально бесконечного индекса всего интернета размеры слов могут быть любыми, к чему нужно быть готовым. Тут бывают и настоящие слова (к примеру, немецкие числительные), но в основном попадается всякий мусор, с которым тоже приходится работать. Естественно, что делать с длинными словами -- вопрос отдельный, их можно урезать, можно дробить, можно вообще не учитывать, но вот падать на них совершенно ни к чему. Недавно столкнулся с ещё одним примером того, что если один человек чего-то сделал, то другой завсегда может это сломать. Ну и то что даже в русском языке слова могут быть любой длины (хотя и словарях их, конечно, не найти). На одном форуме один человек другому написал: ДЭЭЭ....ЭЭЭЭБИЛ
в 1032 символа. И конечно же это слово оказалось чрезвычайно сложным для индексации! Какое коварство: длина слова не только больше 256, но даже 1024-х символов! Все опытные программисты, понятное дело. Но сколько же можно по одним и тем же граблям ходить? В одном месте эти ограничения учли, в другом месте забыли... Автоматический кросс-пост из моего блога.
| | Tuesday, July 7th, 2009 | | 11:06 am |
Лучший пароль
Из рабочей беседы: - А я считаю, что самый лучший и безопасный пароль это шесть звёздочек! Автоматический кросс-пост из моего блога. | | Sunday, July 5th, 2009 | | 6:57 pm |
Бросайте мусор прямо здесь
В бизнес-линче увидел забавную идею социальной рекламы: плакат с надписью « Бросайте мусор прямо здесь» (там ещё есть много приятных деталей в виде названий общественных организаций). Правда, думаю, этот плакат не будет сильно эффективным, так как люди существа социальные и большая часть из них мусорит не по каким-то особым причинам, а просто потому что уже намусорено и значит «здесь так принято», а следовательно лучший способ борьбы с поведением людей это штат уборщиков и легко доступные мусорные урны. Однако я вспомнил, что год тому назад размышлял примерно на ту же тему и у меня возникла пара мыслей относительно надписей в духе «минздрав предупреждает...» на табачных пачках и рекламе алкогольной продукции. Прежде всего, очевидно что эти надписи не работают, потому что они: - неправильно составлены (одно слово «минсоцразвития» чего стоит).
- всегда одинаковые у людей замыливается взгляд и они перестают их замечать.
- почему-то указывают на вред здоровью, хотя курят и пьют совсем не из-за этого, да и про вред тоже все знают.
Соответственно, пользы от них никакой. Правильная надпись должна быть короткой и ёмкой, по возможности должно быть много разных вариантов оформления (самое лучшее если бы надпись разрабатывалась против конкретной упаковки, хотя это невозможно практически) и она должна быть направлена против реальной причины, заставляющей людей курить или пить. Ясно же, что люди начинают курить не из-за ошибочного предположения, будто они себе курением продлят жизнь. Более того, я читал в книжке Малькольма Гладуэлла «Переломный момент», что проводился даже интересный опрос среди курильщиков: их спрашивали, на сколько лет они сократят себе жизнь ежедневным курением. Ответы оказались неожиданными: в среднем курильщики называли число лет, большее чем то, которым их хотели испугать. То есть, все эти «Smoking kills» не работают, так как сообщают общеизвестный факт, с которым как опытный курильщик, так и начинающий, уже смирились. Основная же причина, по которой люди начинают курить или пить, кроется опять же в социальном окружении: если вокруг принято курить и считается, что некурящий чем-то хуже остальных, то конечно люди будут курить несмотря ни на что. Грубо говоря, начинают курить чтобы казаться «круче», а уже потом сюда навешивается наркотическая зависимость, хронический бронхит и рак лёгких. Так что нужно делать вредные привычки непопулярными и они сами собой уменьшатся. К примеру, с курением так и происходит, достаточно посмотреть на издевательства, которым подвергают курящих в Европе: в самолётах курить запретили, сделали места для курения в виде довольно-таки унизительных прозрачных загончиков и т.д. Соотвественно и надпись должна быть не просто про вред курения, а про то что «я знаю что вредно, мне рассказали про рак лёгких, но я всё равно выкуриваю пачку в день, а следовательно я дурак», ну или по простому: «Я ЛОХ». Такую пачку с сигаретами будет стыдно доставать, а это как раз и может заставить покупателя задуматься. PS. Есть, правда, небольшая вероятность что тогда слово «ЛОХ» потеряет негативную окраску и станет популярным. Тогда нужно будет ещё что-нибудь придумать. Автоматический кросс-пост из моего блога. | | Wednesday, June 17th, 2009 | | 3:13 pm |
Каприка Посмотрел пилотный фильм нового сериала «Каприка» -- приквел к «Звёздному крейсеру Галактика» (Battle Star Galactica). На удивление понравилось. Приятный фильм, легко смотрится, с интересным сюжетом. Правда, дальнейшее развитие довольно-таки очевидно, учитывая известный по старому сериалу печальный конец 12 колоний, но всё равно новый сериал обещает быть увлекательным. Честно говоря, я этого не ожидал, потому что сам BSG, который я посмотрел пока болел, оказался очень неровным: хороший первый сезон, более-менее приличный второй и никакой третий. Если бы не было известно, что четвёртый сезон -- последний, я бы его и не досмотрел, настолько всё стало плохо. В Каприке будет показано появление сайлонов и начало войны между сайлонами и людьми, судя по всему, источник конфликта окажется религиозным: противопоставление нового аскетичного монотезима и прогнившего в пороках старого политеизма. Странно, что в BSG персонажи-люди не испытвали никаких эмоций при упоминании единого Бога сайлонов, хотя в Каприке последователи новой веры уже жёстко ассоциируются с терроризмом. Да и религия в BSG не играла такой важной роли в противопоставлении сайлонов и людей: вроде как верят каждый во своё, но ненавидят друг друга исключительно по «рассовой принадлежности». Может быть это будет как раз результатом первой войны, когда всех людей-монотеистов вырежут за пособничество сайлонам? PS. А ещё, оказывается, создатель первого сериала BSG, появившегося в 78-м году, тоже делает свой фильм по тому же материалу. Получается, что название одно, а фильмов уже как минимум три штуки. Только людей путают! Автоматический кросс-пост из моего блога. |
[ << Previous 20 ]
|