The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models

Razzhigaev A.; Mikhalchuk M.; E. Goncharova; Oseledets I.; Dimitrov D. V.; Kuznetsov A.

Публикации

?

The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models

P. 868–874.

Razzhigaev A., Mikhalchuk M., Гончарова Е. Ф., Oseledets I., Dimitrov D. V., Kuznetsov A.

Язык: английский

Текст на другом сайте

Ключевые слова: LLM Transformers Intrinsic dimension Anisotropy

В книге

Findings of the Association for Computational Linguistics: EACL 2024

Association for Computational Linguistics, 2024.

Proceedings of the 4th Workshop on NLP for Music and Audio (NLP4MusA 2026)

Бузаев Ф. А., Mullakhmetov R., Bogachev R. и др., Association for Computational Linguistics, 2026.

Добавлено: 22 июня 2026 г.

B3Emo: Quantifying Affect as a Double-Edged Sword in Strategic LLM Interactions

Stepin A., Mozikov M., Kabanov A. и др., IEEE Access 2026 Vol. 14 P. 48127–48144

Добавлено: 16 июня 2026 г.

Анализ культурных референций в творчестве А. Вознесенского: цифровое исследование имен персоналий

Тюрякова-Матвеева Д. В., Цифровые гуманитарные исследования 2026 № 1 С. 4–26

Статья исследует культурные референции в творчестве Андрея Вознесенского путем анализа упоминаемых им персоналий. Обработано 1678 произведений, включая поэзию, прозу и ранние неопубликованные стихотворения. Методы NER, основанные на инструментах Natasha, spaCy и LLM Grok, позволили изучить частоту упоминания известных лиц и их связь с жанром произведения. Определены ключевые авторы Вознесенского (Пастернак, Пушкин, Маяковский), выявлены особенности жанра ...

Добавлено: 31 мая 2026 г.

Optimizing Computational Infrastructure for Large Language Models in Bioinformatics: A Case Study

Бекназаров Н. С., , in: Parallel Computational Technologies, 19th International Conference, PCT 2025, Moscow, Russia, April 8–10, 2025, Revised Selected Papers. (CCIS, volume 2891)Vol. 2891.: Springer, 2026. P. 3–16.

Добавлено: 19 мая 2026 г.

Efficient Incorporation of New Interactions in Graph Recommenders via Folding-In

Юсупов В. А., Sukhorukov N., Фролов Е. П., User Modelling and User-Adapted Interaction 2026 Vol. 36 Article 2

Графовые системы рекомендаций стали мощной парадигмой для персонализированных рекомендаций. Однако их зависимость от полного переобучения модели для интеграции новых пользователей или новых взаимодействий создаёт барьеры для масштабирования. В реальных системах рекомендаций эта задача становится невыполнимой из-за чрезмерных затрат времени и ресурсов. Чтобы преодолеть это ограничение, мы предлагаем быстрый и эффективный метод обновления графовых рекомендательных моделей ...

Добавлено: 15 марта 2026 г.

When Punctuation Matters: A Large-Scale Comparison of Prompt Robustness Methods for LLMs

Seleznyov M., Чайчук М. В., Ershov G. и др., , in: Findings of the Association for Computational Linguistics: EMNLP 2025.: Association for Computational Linguistics, 2025. P. 20370–20385.

Добавлено: 3 февраля 2026 г.

Measuring Chemical LLM robustness to molecular representations: a SMILES variation-based framework

Ganeeva V., Khrabrov K., Kadurin A. и др., Journal of Cheminformatics 2025 No. 17 Article 164

Добавлено: 3 февраля 2026 г.

Autoregressive generation strategies for Top-K sequential recommendations

Anna Volodkevich, Danil Gusak, Klenitskiy A. и др., User Modelling and User-Adapted Interaction 2025 No. 35 Article 13

Добавлено: 26 января 2026 г.

Diagnosis of the Severity of Depression Using Speech Recording Analysis

Шерман К. В., Игнатов Д. И., Tatiana I. Shishkovskaya и др., , in: Analysis of Images, Social Networks and Texts, 12th International Conference, AIST 2024, Bishkek, Kyrgyzstan, October 17–19, 2024, Revised Selected PapersVol. 15419.: Springer, 2024. P. 94–108.

Добавлено: 23 января 2026 г.

Aspect-Based Sentiment Analysis Using Large Language Models on Museum Visitor Reviews

Anastasia V. Kolmogorova, Elizaveta R. Kulikova, Vladislav V. Lobanov, Supercomputing Frontiers and Innovations 2025 Vol. 12 No. 3 P. 121–140

Добавлено: 30 ноября 2025 г.

AutoJudge: Judge Decoding Without Manual Annotation

Roman Garipov, Fedor Velikonivtsev, Ivan Ermakov и др., , in: 39th Conference on Neural Information Processing Systems (NeurIPS 2025).: NeurIPS, 2025. P. 94605–94642.

Добавлено: 6 ноября 2025 г.

Strategizing with AI: Insights from a Beauty Contest Experiment

Iuliia Alekseenko, Дагаев Д. А., Sofiia Paklina и др., Journal of Economic Behavior and Organization 2025 Vol. 240 Article 107330

Добавлено: 6 ноября 2025 г.

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Anton R., Mikhalchuk M., Rahmatullaev T. и др., , in: Findings of the Association for Computational Linguistics: NAACL 2025.: Association for Computational Linguistics, 2025. P. 7757–7764.

Мы предлагаем методы количественной оценки того, как большие языковые модели (LLM) кодируют и хранят контекстную информацию, и показываем, что токены, обычно считающиеся второстепенными (например, детерминативы и знаки препинания), на деле несут неожиданно высокий объём контекста. В частности, удаление таких токенов — особенно стоп-слов, артиклей и запятых — стабильно ухудшает качество на MMLU и BABILong-4k, даже ...

Добавлено: 6 ноября 2025 г.

Исследования благополучия с помощью передовых методов обработки естественного языка (NLP): перспективы и ограничения

Воеводина Е. Ю., Современная зарубежная психология 2025 Т. 14 № 3 С. 172–181

Контекст и актуальность. Исследования благополучия столкнулись с противоречиями и ограничениями, проистекающими из ограничений метода психометрических самоотчетных шкал. Данные методы критикуются за низкую экологическую валидность, ограниченную информативность и трудности в операционализации комплексного конструкта благополучия. В то же время, стремительное развитие технологий обработки естественного языка (natural language processing, NLP) открывает новые возможности для преодоления этих ограничений. Цель. Провести обзор ...

Добавлено: 9 октября 2025 г.

Оценка моделей LLM по степени готовности решать задачи управления в области ESG

Сторчевой М. А., Мыльников Л. А., Чернышев В. В. и др., / SSRN. Серия "Working Papers". 2025.

Внимание к охране природы принимает все большую значимость для бизнеса с одной стороны в связи с ужесточением в природоохранном законодательстве, а с другой в связи с использованием ESG рейтингов при принятии решений о коммерческой деятельности компаний. Составление рейтинга LLM систем, способных оказывать консультационные услуги в области природоохраны и ESG, позволяет осуществить выбор такой системы для ...

Добавлено: 18 сентября 2025 г.

Цифровой театр абсурда: могут ли нейросети поставить новую научную проблему перед психологией? Кейс-сравнение ChatGPT и DeepSeek

Хашутогова У. П., Березнер Т. А., Поддьяков А. Н., Новые психологические исследования 2025 № 3 С. 100–125

Бурное развитие технологий искусственного интеллекта не может оставить в стороне исследователей-психологов. Хотя нейросети начинают использоваться почти во всех сферах человеческой деятельности, остаются неясными границы их применимости, насколько создаваемый ими контент является действительно новым и вместе с тем полезным пользователю. Сторонники нейросетей заявляют о необходимости их тотального внедрения, скептики же подвергают серьезному сомнению почти все компетенции ...

Добавлено: 4 сентября 2025 г.

Interpreting Metaphorical Language: A Challenge to Artificial Intelligence

Skrynnikova I.V., Вестник Волгоградского государственного университета. Серия 2: Языкознание 2025 Vol. 23 No. 5 P. 99–107

Добавлено: 1 августа 2025 г.

Comparative Study of LoRA and Full Fine-Tuning in Large Language Models

E.V. Surikova, E.A. Sabidaeva, , in: Параллельные вычислительные технологии – XIX всероссийская конференция с международным участием, ПаВТ'2025, г. Москва, 8–10 апреля 2025 г. Короткие статьи и описания плакатов.: Челябинск: Издательский центр ЮУрГУ, 2025. P. 90–98.

Добавлено: 3 июля 2025 г.

HR-Tech Automation: A Case Study of Resume Design using GenAI Technologies

Suleykin, A., Babenko, R., Panfilov, P., , in: Proceedings of the 35th International DAAAM Virtual Symposium ''Intelligent Manufacturing & Automation''Vol. 1.: NY: DAAAM International Vienna, 2024. Ch. 20 P. 0157–0164.

Добавлено: 5 апреля 2025 г.

OmniDialog: A Multimodal Benchmark for Generalization Across Text, Visual, and Audio Modalities

Razzhigaev A., Kurkin M., Гончарова Е. Ф. и др., , in: Proceedings of the 2nd GenBench Workshop on Generalisation (Benchmarking) in NLP.: Association for Computational Linguistics, 2024. P. 183–195.

Добавлено: 21 февраля 2025 г.