LM-Polygraph: Uncertainty Estimation for Language Models

Fadeeva E.; Vashurin R.; A. Tsvigun; Vazhentsev A.; Petrakov S.; Fedyanin K.; Daniil Vasilev; E. Goncharova; Panchenko A.; Panov M.; Baldwin T.; Shelmanov A.

doi:10.18653/v1/2023.emnlp-demo.41

?

LM-Polygraph: Uncertainty Estimation for Language Models

P. 446 –461.

Fadeeva E., Vashurin R., Цвигун А. О., Vazhentsev A., Petrakov S., Fedyanin K., Daniil Vasilev, Гончарова Е. Ф., Panchenko A., Panov M., Baldwin T., Shelmanov A.

Язык: английский

DOI

Текст на другом сайте

Ключевые слова: Uncertainty Estimation LLM

В книге

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing

Singapore: Association for Computational Linguistics, 2023.

Proceedings of the 4th Workshop on NLP for Music and Audio (NLP4MusA 2026)

Бузаев Ф. А., Mullakhmetov R., Bogachev R. и др., Association for Computational Linguistics, 2026.

Добавлено: 22 июня 2026 г.

B3Emo: Quantifying Affect as a Double-Edged Sword in Strategic LLM Interactions

Stepin A., Mozikov M., Kabanov A. и др., IEEE Access 2026 Vol. 14 P. 48127–48144

Добавлено: 16 июня 2026 г.

Анализ культурных референций в творчестве А. Вознесенского: цифровое исследование имен персоналий

Тюрякова-Матвеева Д. В., Цифровые гуманитарные исследования 2026 № 1 С. 4–26

Статья исследует культурные референции в творчестве Андрея Вознесенского путем анализа упоминаемых им персоналий. Обработано 1678 произведений, включая поэзию, прозу и ранние неопубликованные стихотворения. Методы NER, основанные на инструментах Natasha, spaCy и LLM Grok, позволили изучить частоту упоминания известных лиц и их связь с жанром произведения. Определены ключевые авторы Вознесенского (Пастернак, Пушкин, Маяковский), выявлены особенности жанра ...

Добавлено: 31 мая 2026 г.

Optimizing Computational Infrastructure for Large Language Models in Bioinformatics: A Case Study

Бекназаров Н. С., , in: Parallel Computational Technologies, 19th International Conference, PCT 2025, Moscow, Russia, April 8–10, 2025, Revised Selected Papers. (CCIS, volume 2891)Vol. 2891.: Springer, 2026. P. 3–16.

Добавлено: 19 мая 2026 г.

When Punctuation Matters: A Large-Scale Comparison of Prompt Robustness Methods for LLMs

Seleznyov M., Чайчук М. В., Ershov G. и др., , in: Findings of the Association for Computational Linguistics: EMNLP 2025.: Association for Computational Linguistics, 2025. P. 20370–20385.

Добавлено: 3 февраля 2026 г.

Measuring Chemical LLM robustness to molecular representations: a SMILES variation-based framework

Ganeeva V., Khrabrov K., Kadurin A. и др., Journal of Cheminformatics 2025 No. 17 Article 164

Добавлено: 3 февраля 2026 г.

Aspect-Based Sentiment Analysis Using Large Language Models on Museum Visitor Reviews

Anastasia V. Kolmogorova, Elizaveta R. Kulikova, Vladislav V. Lobanov, Supercomputing Frontiers and Innovations 2025 Vol. 12 No. 3 P. 121–140

Добавлено: 30 ноября 2025 г.

AutoJudge: Judge Decoding Without Manual Annotation

Roman Garipov, Fedor Velikonivtsev, Ivan Ermakov и др., , in: 39th Conference on Neural Information Processing Systems (NeurIPS 2025).: NeurIPS, 2025. P. 94605–94642.

Добавлено: 6 ноября 2025 г.

Strategizing with AI: Insights from a Beauty Contest Experiment

Iuliia Alekseenko, Дагаев Д. А., Sofiia Paklina и др., Journal of Economic Behavior and Organization 2025 Vol. 240 Article 107330

Добавлено: 6 ноября 2025 г.

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Anton R., Mikhalchuk M., Rahmatullaev T. и др., , in: Findings of the Association for Computational Linguistics: NAACL 2025.: Association for Computational Linguistics, 2025. P. 7757–7764.

Мы предлагаем методы количественной оценки того, как большие языковые модели (LLM) кодируют и хранят контекстную информацию, и показываем, что токены, обычно считающиеся второстепенными (например, детерминативы и знаки препинания), на деле несут неожиданно высокий объём контекста. В частности, удаление таких токенов — особенно стоп-слов, артиклей и запятых — стабильно ухудшает качество на MMLU и BABILong-4k, даже ...

Добавлено: 6 ноября 2025 г.

Исследования благополучия с помощью передовых методов обработки естественного языка (NLP): перспективы и ограничения

Воеводина Е. Ю., Современная зарубежная психология 2025 Т. 14 № 3 С. 172–181

Контекст и актуальность. Исследования благополучия столкнулись с противоречиями и ограничениями, проистекающими из ограничений метода психометрических самоотчетных шкал. Данные методы критикуются за низкую экологическую валидность, ограниченную информативность и трудности в операционализации комплексного конструкта благополучия. В то же время, стремительное развитие технологий обработки естественного языка (natural language processing, NLP) открывает новые возможности для преодоления этих ограничений. Цель. Провести обзор ...

Добавлено: 9 октября 2025 г.

Оценка моделей LLM по степени готовности решать задачи управления в области ESG

Сторчевой М. А., Мыльников Л. А., Чернышев В. В. и др., / SSRN. Серия "Working Papers". 2025.

Внимание к охране природы принимает все большую значимость для бизнеса с одной стороны в связи с ужесточением в природоохранном законодательстве, а с другой в связи с использованием ESG рейтингов при принятии решений о коммерческой деятельности компаний. Составление рейтинга LLM систем, способных оказывать консультационные услуги в области природоохраны и ESG, позволяет осуществить выбор такой системы для ...

Добавлено: 18 сентября 2025 г.

Цифровой театр абсурда: могут ли нейросети поставить новую научную проблему перед психологией? Кейс-сравнение ChatGPT и DeepSeek

Хашутогова У. П., Березнер Т. А., Поддьяков А. Н., Новые психологические исследования 2025 № 3 С. 100–125

Бурное развитие технологий искусственного интеллекта не может оставить в стороне исследователей-психологов. Хотя нейросети начинают использоваться почти во всех сферах человеческой деятельности, остаются неясными границы их применимости, насколько создаваемый ими контент является действительно новым и вместе с тем полезным пользователю. Сторонники нейросетей заявляют о необходимости их тотального внедрения, скептики же подвергают серьезному сомнению почти все компетенции ...

Добавлено: 4 сентября 2025 г.

Interpreting Metaphorical Language: A Challenge to Artificial Intelligence

Skrynnikova I.V., Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Vol. 23 No. 5 P. 99–107

Добавлено: 1 августа 2025 г.

Comparative Study of LoRA and Full Fine-Tuning in Large Language Models

E.V. Surikova, E.A. Sabidaeva, , in: Параллельные вычислительные технологии – XIX всероссийская конференция с международным участием, ПаВТ'2025, г. Москва, 8–10 апреля 2025 г. Короткие статьи и описания плакатов.: Челябинск: Издательский центр ЮУрГУ, 2025. P. 90–98.

Добавлено: 3 июля 2025 г.

HR-Tech Automation: A Case Study of Resume Design using GenAI Technologies

Suleykin, A., Babenko, R., Panfilov, P., , in: Proceedings of the 35th International DAAAM Virtual Symposium ''Intelligent Manufacturing & Automation''Vol. 1.: NY: DAAAM International Vienna, 2024. Ch. 20 P. 0157–0164.

Добавлено: 5 апреля 2025 г.

OmniDialog: A Multimodal Benchmark for Generalization Across Text, Visual, and Audio Modalities

Razzhigaev A., Kurkin M., Гончарова Е. Ф. и др., , in: Proceedings of the 2nd GenBench Workshop on Generalisation (Benchmarking) in NLP.: Association for Computational Linguistics, 2024. P. 183–195.

Добавлено: 21 февраля 2025 г.

MERA: A Comprehensive LLM Evaluation in Russian

Феногенова А. С., Chervyakov, A., Martynov N. и др., , in: Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) 2024Vol. 1: Long Papers.: Bangkok: Association for Computational Linguistics, 2024. P. 9920–9948.

Добавлено: 17 февраля 2025 г.

Your Transformer is Secretly Linear

Razzhigaev A., Mikhalchuk M., Гончарова Е. Ф. и др., , in: Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers) 2024Vol. 1: Long Papers.: Bangkok: Association for Computational Linguistics, 2024. P. 5376–5384.

Добавлено: 17 февраля 2025 г.

The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models

Razzhigaev A., Mikhalchuk M., Гончарова Е. Ф. и др., , in: Findings of the Association for Computational Linguistics: EACL 2024.: Association for Computational Linguistics, 2024. P. 868–874.

Добавлено: 17 февраля 2025 г.

ChatGPT, текст, информация: критический анализ

Комашко М. Н., Труды по интеллектуальной собственности 2024 Т. 50 № 3 С. 118–128

В работе рассматриваются вопросы теории и практики, связанные с таким типом искусственного интеллекта, как большие языковые модели, в частности, ChatGPT. Основное внимание уделено сферам человеческой деятельности, в которых обмен информацией, изложенной в виде текста, имеет наибольшее значение: науке, образованию и журналистике (медиасфере). Описывается опыт взаимодействия пользователей с чат-ботами. Достаточно подробно рассматривается принцип работы больших языковых моделей. ...

Добавлено: 29 декабря 2024 г.

Automated Speech Act Annotation in a Russian Spoken Corpus Using Large Language Models: A Comparative Study

Шерстинова Т. Ю., Viktoria Firsanova, , in: PROCEEDING OF THE 36TH CONFERENCE OF FRUCT ASSOCIATION.: [б.и.], 2024. P. 912–920.

Добавлено: 29 ноября 2024 г.