Title: Да пытання аб укладанні корпуса беларускіх навуковых тэкстаў 1920-1930-х гг.
Other Titles: On the issue of corpora creation of belarusian scientific texts of the 1920s–1930s
Authors: Naurotskaya I. V.
Keywords: публикации ученых;гісторыя беларускай літаратурнай мовы;навуковы стыль;беларускія навуковыя тэксты;корпусная лінгвістыка;history of the Belarusian literary language;scientific style;Belarusian scientific texts;corpus linguistics;история белорусской литературы;научный стиль;белорусские научные тексты;корпусная лингвистика
Issue Date: 2021
Publisher: БГТУ
Citation: Наўроцкая, І. В. Да пытання аб укладанні корпуса беларускіх навуковых тэкстаў 1920-1930-х гг. / І. В. Наўроцкая // Труды БГТУ. Серия 4, Принт- и медиатехнологии. – 2021. – № 1 (243). – С. 74–78.
Abstract: Выкарыстанне інфармацыйных тэхналогій у мовазнаўстве дазваляе ствараць вялікія масівы тэкставых даных, распрацоўваць адпаведнае праграмнае забеспячэнне, што адкрывае новыя магчымасці ў лінгвістычных корпусных даследаваннях. Гістарычная значнасць навуковага стылю 1920–1930-х гг. выступае аб’ектыўнай і актуальнай задачай для стварэння дыяхранічнага корпуса беларускіх навуковых тэкстаў. Шырокая тэматычная і жанравая разнастайнасць друкаванай перакладной і аўтарскай навуковай літаратуры 1920–1930-х гг. адкрываюць перспектывы для стварэння адпаведнага корпуса навуковых тэкстаў, які можа быць як аднамоўным беларускім, так і двухмоўным – з прыцягненнем арыгінальных тэкстаў, з якіх рабіліся пераклады. Да актуальных задач па распрацоўцы корпуса беларускіх навуковых тэкстаў 1920–1930-х гг. адносяцца стварэнне анатаванага спіса крыніц для выбару найбольш рэпрэзентатыўных адзінак, апрацоўка PDF-файлаў навуковых выданняў і выяўленне ў іх тэкставага слоя. Стварэнне дыяхранічнага корпуса навуковай літаратуры дазволіць якасна прааналізаваць значны аб’ём інфармацыі і атры- маць колькасныя паказчыкі для абгрунтаваных высноў, выявіць факты дынамікі моўных зменаў.
Alternative abstract: The use of information technology in linguistics allows creating large arrays of text data, developing the relevant software that provides new opportunities in linguistic corpus research. The historical significance of the scientific style in the 1920s–1930s acts as an objective and urgent task for the creation of a diachronic corpus of Belarusian scientific texts. Extensive thematic and genre variety of printed translated and authored scientific literature of the 1920s–1930s offers the prospect for creating the corpus of scientific texts, which can be both monolingual Belarusian and bilingual – with the involvement of original texts from which translations were made. Developing the corpus of Belarusian scientific texts from the 1920s–1930s includes devising an annotated list of sources to select the most representative ones, processing PDF files of scientific journals and identifying a text layer in them. The creation of the diachronic corpus of scientific literature will allow to qualitatively analyze a significant amount of information, obtain quantitative indicators for reasoned conclusions, reveal the facts of the language changes dynamics.
