ИИ против кибепреступников: как DarkBERT разгадывает тайны тёмной сети

Чт 18 Май 2023 18:09

Тёмная сеть (dark web) — это часть Интернета, которая скрыта от обычных пользователей и доступна только через специальные анонимизирующие программы, такие как Tor. В тёмной сети происходят различные незаконные действия, такие как продажа запрещённых веществ, оружия, фальшивых документов и хакерских услуг.

Учёные из Южной Кореи создали искусственный интеллект, который может анализировать и извлекать полезную информацию из текстов тёмной сети. Их ИИ называется DarkBERT и основан на архитектуре RoBERTa — одном из самых мощных подходов к обработке естественного языка, разработанном в 2019 году.

Для обучения модели учёные собрали большую базу данных из текстов тёмной сети, просканировав её через сеть Tor, и затем отфильтровали повторяющуюся информацию, а также информацию не по теме. Потом они использовали эту базу данных для обучения RoBERTa LLM — модели, которая может обрабатывать тексты тёмной сети и выделять в них ключевые элементы.

Учёные показали, что DarkBERT превосходит другие большие языковые модели по качеству анализа текстов тёмной сети. Это может помочь специалистам по кибербезопасности и правоохранительным органам проникнуть глубже в уголки интернета, где скрываются преступники. Однако DarkBERT ещё не доведён до совершенства и требует дальнейшего обучения и настройки. Как точно он будет использоваться и какие знания сможет предоставить — пока неизвестно.

Статья уведена с www.securitylab.ru.

NetLan.ru жив уже 17 лет 187 дней 19 часов 1 минута 54 секунды
СМК NetLan (Nettlesome Landloper) — некоммерческий интернет-ресурс.
Весь данный интернет-ресурс и всё созданное или размещённое на нём используется в личных целях.