Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/39457
Full metadata record
DC FieldValueLanguage
dc.contributor.authorЗахарик, Ю. А.-
dc.contributor.authorПрокурат, Д. М.-
dc.date.accessioned2020-07-09T14:31:45Z-
dc.date.available2020-07-09T14:31:45Z-
dc.date.issued2020-
dc.identifier.citationЗахарик, Ю. А. Использование перцептивного хэша в нахождении необходимых сообщений на примере выборки из твиттера / Ю. А. Захарик, Д. М. Прокурат // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сб. материалов VI Междунар. науч.-практ. конф., Минск, 20-21 мая 2020 года : в 3 ч. Ч. 2 / редкол.: В. А. Богуш [и др.]. – Минск : Бестпринт, 2020. – С. 266–273.ru_RU
dc.identifier.isbn978-985-90533-9-9-
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/39457-
dc.description.abstractВ данной работе была рассмотрена проблема нахождения схожих сообщений на основе выборки из Твиттера. Рассмотрены следующие алгоритмы: расстояние Левенштейна, нормализованное расстояние Левенштейна, Soundex, Phonex, алгоритм Джаро, Q-граммы, алгоритм LCS, алгоритм Metric LCS, SIFT4, алгоритм Дамерлау-Левенштейна, алгоритм косинусов и алгоритм подсчета букв. Было произведено сокращение выборки и упрощение твитов. Предложен оптимальный алгоритм решения задачи.ru_RU
dc.language.isoruru_RU
dc.publisherБеспринтru_RU
dc.subjectматериалы конференцийru_RU
dc.subjectперцептивный хэшru_RU
dc.subjectсравнение текстовru_RU
dc.subjectалгоритм Джароru_RU
dc.subjectтвиттер-
dc.subjectperceptual hash-
dc.subjecttext comparison-
dc.subjectcosine algorithm-
dc.subjectJaro's algorithm-
dc.subjecttwitter-
dc.titleИспользование перцептивного хэша в нахождении необходимых сообщений на примере выборки из твиттераru_RU
dc.title.alternativeUsing perceptual hashing in finding similar messages by the example of sample from twitter-
dc.typeArticleru_RU
local.description.annotationIn this paper, the problem of finding similar messages based on a selection from Twitter was considered. The following algorithms are considered: Levenshtein distance, normalized Levenshtein distance, Soundex, Phonex, Jaro algorithm, Q-grams, LCS algorithm, Metric LCS algorithm, SIFT4, Damerlau-Levenshtein algorithm, cosine algorithm and letter counting algorithm. There was a reduction in sampling and simplification of tweets. An optimal algorithm for solving the problem is proposed.-
Appears in Collections:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : материалы конференции (2020)

Files in This Item:
File Description SizeFormat 
Zakharik_Ispolzovaniye.pdf656.37 kBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.