Ученые создали базу данных чешской лексики 16-18 веков

29-10-2010

Лингвисты создали уникальную на этот момент базу данных лексики чешского языка эпохи классического гуманизма и барокко, в которую включено порядка полумиллиона наименований. Можно сказать, что речь идет о первом пособии для изучения чешского языка данной эпохи.

База данных лексики чешского языка эпохи классического гуманизма и барокко появилась на основе бумажной картотеки, которую с 1971 по 2003 год создавал чешских лингвист Зденек Тыл. В 2004 году ее приобрел Институт чешского языка Академии Наук ЧР, сотрудники которого на протяжении последующих четырех лет разрабатывали проект, результатом которого стало единственное в своем роде лексическое пособие для изучения чешских письменных материалов 1500-1780 годов. Основой для картотеки стали Королевская библия и другие важные письменные источники того времени. Послушаем сотрудника Института чешского языка Академии наук ЧР Петра Нейедлого:

«Наша цель довольно проста. Составить ранее не существующее пособие для изучения чешского языка эпохи классического гуманизма и барокко с точки зрения словарного состава. Примечательно, что для постижения чешского средневекового языка, приблизительно до 1500 года, у нас имеются, в том числе, большие толковые словари. Как и для исследования нового чешского языка после периода национального Возрождения. Но именно для периода времени с 1500 по 1780 годы у нас практически ничего не было».

Ян ГебауэрЯн Гебауэр Впрочем, о лексике данной эпохи, преимущественно приходившейся на времена правления в Чехии Габсбургов, некоторые знания можно почерпнуть в трудах богемиста 19-20 веков Яна Гебауэра, автора Словаря старого чешского языка. Сведения можно найти и у чешского филолога, писателя и переводчика 18-19 веков Йозефа Юнгманна в его Словаре немецкого и чешского языков. Но материалов этих было недостаточно:

«Поэтому мы решили создать электронную базу данных с фрагментами текстов на основе картотеки знатока старого чешского языка и средневековой латины Зденека Тыла, который работал над ней картотекой более 30 лет.

Лингвист мечтал о том, чтобы издать небольшой словарь чешского языка этих эпох. Но этого так и не произошло. Ныне база данных доступна профессиональной общественности в Интернете.

«Прежде всего, стоит заметить, что полмиллиона упоминаний, это не полмиллиона слов. Полмиллиона упоминаний за 300 лет — достаточно мало. Это — одна из причин, по которой мы решили, что не будем выпускать словарь. Что же касается источников, их выбор, с моей точки зрения, был проведен очень качественно. Там можно найти тексты литературные, фрагменты из документальных материалов, издаваемых в книжном варианте. То есть, данный спектр является достаточно широким».

До какой степени современный чех понимал бы своих предков?

«Некоторые тексты ясны без проблем, в том числе, средневековые. С некоторыми намного сложнее. В них много слов, принятых из других языков. Прежде всего, из немецкого или латыни. Есть и слова, которые в чешском языке встречались лет 50 или 70 лет, после чего пропали. Либо форма слова известна, а значение его полностью изменилось. Это такие интересные моменты чешского языка», - рассказал Петр Нейедлы.

Предполагается расширение базы данных до 750 000 фрагментов и ее объединение с подобными проектами философского факультета Карлова университета.

29-10-2010