Подгнило что-то в королевстве

(Март 2014)

В каждой шутке, как всем известно, есть доля истины. И когда шутка затягивается, а истина проступает все более отчетливо, то в итоге всем становится как-то совсем уже и не смешно…

Когда в феврале нынешнего года журнал Nature опубликовал историю о тревожном росте как бы научных публикаций, целиком сконструированных программой-генератором из грамматически правильных, но абсолютно бессмысленных фраз, то поневоле вспомнили и давнюю студенческую шутку, от которой пошла эта напасть.

Программу «бредогенератор» SCIgen около десяти лет назад забавы ради написали несколько аспирантов МТИ, Массачусетского технологического института. Ну а теперь, как выяснил французский исследователь Сирил Лаббе, уже на сотни идет счет статей с чепухой от SCIgen, обнаруживаемых в подписной (кстати, весьма недешевой) продукции солидных научных издательств.
Так, в сборниках трудов конференций, выпускаемых издательским домом Springer, выявлено по меньшей мере 16 порождений бредогенератора. А в докладах конференций, публикуемых инфотехнологическим издательством IEEE (Institute of Electrical and Electronic Engineers), статей с ахинеей от SCIgen обнаружилось почти на порядок больше — свыше 100 как минимум…

Чтобы стало яснее, каким образом нынешняя наука сумела дойти до жизни такой, имеет смысл хотя бы вкратце вспомнить предысторию вопроса. Причем делать это надо в непосредственном сопоставлении с параллельным развитием современного искусства и философии — по причинам, которые станут понятны по ходу рассказа.

Вообще говоря, история шуток и мистификаций в литературе, искусстве и науке берет начало в глубине столетий, однако здесь вполне достаточно ограничиться наиболее характерными событиями последнего полувека.

А начать рассказ уместно с престранной ситуации в современном искусстве, обсуждая которое, высоколобые критики-интеллектуалы и просто ценители авангарда с умным видом могут превозносить абсолютно любую чушь. Ибо так им видится подлинная красота.

В этой связи очень к месту напомнить историю 1964 года, когда немалый шум наделали картины некоего Пьера Брассо (Pierre Brassau), неизвестного гения с трудной судьбой и «современного Ван Гога» авангардизма. Ну а когда творчество Брассо собрало достаточное количество восторженных откликов, то стало известно, что вся эта мазня – развлечения четырехлетнего шимпанзе Петера, живущего в одном из шведских зоопарков…

В те же 1960-70-е годы компьютерщики начали развлекаться с программами для генерации текстов – типа рифмованных стихов или заумной псевдофилософской эссеистики. Апофеозом этого творчества можно считать появившуюся в 1996 программу «Генератор постмодернизма» Эндрю Балхэка и созвучную ей шутку, которую в том же году устроил над философами математик Алан Сокал.

Смастерив бессмысленный текст в духе «Генератора постмодернизма», Сокал за собственной подписью отправил его смеха ради в журнал Social Text, имеющий с США репутацию серьезного философского издания. И можно представить себе чувства сторон, когда данная статья была действительно опубликована – ибо для редакторов журнала вся эта ахинея ничем особенным не отличалась от прочих публикаций издания…

Весьма близкие этой картине процессы в то же самое время стали отмечаться, как ни странно, и в точных науках – в частности, в теоретической физике. Самой громкой историей этого ряда, наверное, можно считать знаменитое «дело Богдановых».

Французские братья-близнецы Игорь и Гришка Богдановы, ведущую свою родословную от древних дворянских домов России и Австрии, на родине были известны как успешные телепродюсеры и создатели популярных ТВ-передач о достижениях науки. Со временем братья ощутили себя в мире ученых настолько своими, что за 1990-е годы настрогали публикаций в разных научных журналах Европы, Америки и Азии, а затем и защитили по диссертации – став «докторами наук» в крайне нетривиальной области квантовой гравитации.

Лишь на этом этапе активность шустрых братьев попала в поле зрения ученых, действительно понимающих предмет. И один из них – Джон Баэз – не смог удержаться, в 2002 году публично объявив, что для специалиста, ориентирующегося в такого рода вещах, научное творчество Богдановых представляет собой полнейшую чепуху – набор модных терминов и фразеологических штампов, выстроенных в более-менее связные тексты…

Практически все, кто обеспечивал появление в физической науке двух новых светил – братьев Богдановых – встали на защиту ими содеянного. И вот тут-то выяснилось, что в теоретической физике ныне уже нет критериев, надежно отделяющих ложь от правды. И то, что одним специалистам представляется полной ахинеей, для других выглядит как интересные новаторские идеи. Примерно как в искусстве или философии.

Ну а еще через три года, начиная с 2005, пошла церия серия громких (и позорных, что ни говори) историй вокруг программ-генераторов в стиле розыгрыша от Алана Сокала, но теперь уже для порождения научных статей в области информатики и теоретической физики.

Здесь самой знаменитой, бесспорно, стала программа SCIgen. С ее помощью аспиранты МТИ (Jeremy Stribling, Dan Aguayo, Maxwell Krohn) наглядно продемонстрировали, как жуликоватые организаторы научных конференций бомбят ученых спамом – своими запросами на статьи и доклады – а затем с удовольствие принимают практически любой мусор. Ибо на самом деле таким конференциям нужны не доклады, а деньги – в виде суммы сбора, необходимого для регистрации на их «научном мероприятии».

Когда написанная всего за несколько дней программа-шутка SCIgen стала мгновенно, по нажатию кнопки, «выпекать» все новые и новые статьи в области информатики, аспиранты хохмы ради стали рассылать их в ответ на каждый новый спам-запрос от очередной конференции. И вскоре, к своему удивлению, стали получать подтверждения о том, что их доклады приняты и включены в план выступлений.

Весьма впечатленные своими успехами, Стриблинг и Крон не только опубликовали в Сети подробности о кухне происходящего, но и сделали свою программу SCIgen свободно доступной для всех. Дабы каждый мог лично убедиться, до какой степени «подгнило что-то в датском королевстве».

Поскольку же мир ученых не знает государственных границ, вскоре пошли сигналы о точно таких же бедах науки и в других странах. В России, в частности, громче всех прогремел скандал 2008 года – вокруг знаменитой ныне статьи про «Корчеватель» (Rooter).

Наш известный математик и биолог, профессор биоинформатики Михаил Гельфанд пропустил одно из порождений SCIgen через программу автоматического перевода и чуток подправил в ней совсем уж очевидные ляпы. А затем под вымышленным именем успешно опубликовал сие творение в рецензируемом «Журнале научных публикаций аспирантов и докторантов» (ЖНПАиД), входящем в так называемый «список ВАКа» – составленный Высшей аттестационной комиссией перечень ведущих изданий, где должны быть опубликованы основные научные результаты диссертаций.

Еще одним заметным событием в том же русле стало появление в 2010 новой онлайновой забавы – сайта под названием «Шнархив» (snarxiv.org). Программа делает примерно то же самое, что и SCIgen, но только уже в области теоретической физики. Псевдонаучная ахинея и здесь порождается программой с такой впечатляющей натуралистичностью, что для людей, несведущих в предмете, почти невозможно отличить реальный научный текст от его юмористической подделки.

Но шутки шутками, как говорится, а подлинный черный юмор ситуации сводится к тому, что некие не совсем порядочные представители мира ученых усмотрели в SCIgen и ей подобных программах очень удобное средство для повышения своего научного рейтинга (который во многом автоматически складывается из количества публикаций, выступлений на конференциях и числа цитирований статей данного автора в других работах).

Именно эту беду, собственно, и вскрыло упомянутое в самом начале исследование Сирила Лаббе. Который написал собственную программу – для автоматического выявления статей, порожденных генераторами текста. И сходу обнаружил почти полторы сотни таких подделок в сборниках трудов конференций, публикуемых солиднейшими научными издательствами.

Комментируя открытия Лаббе, один из создателей SCIgen, Максвелл Крон (возглавляющий ныне небольшую фирму ИТ-безопасности в Нью-Йорке) особо подчеркнул, что детективные изыскания французского ученого приоткрывают реальную картину того, насколько глубоки и серьезны проблемы современной науки.

Ученые находятся под постоянным и интенсивным давлением – они обязательно должны публиковать новые работы, и чем больше, тем лучше для карьеры. Университеты и исследовательские центры – для повышения собственного статуса – также всячески подталкивают сотрудников к наращиванию числа публикаций. Ну а научные журналы и конференции, пользуясь такой ситуацией, стремятся обратить статьи в свои прибыли.

Иначе говоря, как формулирует это Крон, сформировался целый академический андеграунд – где каждая из сторон, похоже, извлекает из ситуации свои выгоды. Научные институты при этом сильнейшим образом обдираются, поскольку они вынуждены платить издательствам огромные суммы подписки на журналы со всеми этими материалами.

На всю подобную активность реально затрачивается масса ресурсов, времени и денег, но при этом собственно в науку тут не добавляется абсолютно ничего… Конечно, с этой явно нездоровой тенденцией пытаются бороться. Но, анализируя достаточно отчетливую уже картину злоупотреблений на предмет дальнейшего развития, в будущем эксперты прогнозируют лишь нарастание обозначившейся гонки вооружений.

По мере совершенствования алгоритмов генерации, компьютеры будут порождать все более и более убедительные статьи-фальшивки. А другие программы-детекторы, в свою очередь, будут развиваться для все более эффективного выявления подобного мусора.

Но самое неприятное, что победить в этой борьбе те или другие программы не способны. Иначе говоря, сами собой столь серьезные проблемы науки с помощью компьютеров не разрешаются.

Тут всю систему менять надо…

Related