Enhancing bankruptcy prediction efficiency using synthetic data

?

Enhancing bankruptcy prediction efficiency using synthetic data

Business Informatics. 2025. Vol. 19. No. 3. P. 22–47.

Прогнозирование финансовой несостоятельности компаний имеет решающее значение для инвесторов, кредиторов и регулирующих органов. Однако доступ к высококачественным, сбалансированным данным для обучения моделей часто ограничен из-за соображений конфиденциальности, нехватки информации или особенностей предоставления финансовой отчетности. В данной работе исследуется потенциал методов создания синтетических данных для увеличения экземпляров миноритарного класса в несбалансированных наборах данных и тем самым потенциального улучшения моделей прогнозирования несостоятельности. В работе сравнивается производительность различных методов снижения дисбаланса, включая такие классические, как, например, метод синтетического увеличения выборки меньшинства (Synthetic Minority Over-sampling Technique), с новыми подходами к генерации синтетических данных на основе байесовских сетей, маргинальных распределений, случайных лесов и генеративных состязательных сетей. Исследуется эффективность этих методов с точки зрения их способности улучшить такие показатели классификации, как коэффициент Джини, среднее геометрическое, доля ложно положительных и ложно отрицательных решений. В качестве выборки для эксперимента взяты реальные финансовые показатели промышленных компаний малого и среднего бизнеса Финляндии за 2021. Полученные результаты вносят вклад в растущий объем знаний о генерации синтетических данных и их применении для решения проблем несбалансированных наборов данных и улучшения прогностического моделирования в финансовой сфере, а также дают представление об эффективности различных методов создания синтетических данных для сэмплирования несбалансированных наборов данных и повышения точности и надежности моделей прогнозирования несостоятельности фирм.

Язык: английский

DOI

Текст на другом сайте

Artificial intelligence framework for multi-pathology risk assessment from retinal fundus images: deep learning approach to 15-disease screening

Vasilev R., Савченко А. В., Blinov P. и др., Frontiers in Medicine 2026 Vol. 13 Article 1778404

Добавлено: 16 июня 2026 г.

Автоматическое определение эмоционального состояния участников предметных разговоров по транскрипциям речи

Двойникова А. А., Мамонтов Д. Ю., Карпов А. А., В кн.: Альманах научных работ молодых ученых Университета ИТМОТ. 3.: Университет ИТМО, 2021. С. 63–68.

В работе проводятся экспериментальные исследования по определению уровня эмоциональных проявлений в текстовых транскрипциях базы данных K-EmoCon. Рассматривается влияние сбалансирования классов при обучении классификаторов на точность определения эмоций. В статье устанавливается базовый стандарт результатов по классификации уровня эмоций дикторов в текстовых транскрипциях. ...

Добавлено: 24 апреля 2026 г.

Assessing the Big Data Value: Approaches and Methods

Мальцева С. В., , in: Информатика и прикладная математика: Материалы X Международной научно-практической конференции (08.10 - 11.10.2025 г.)Т. 1: Сборник материалов часть 1.: Алматы: Институт информационных и вычислительных технологий КН МНВО РК, 2025.

Добавлено: 3 марта 2026 г.

Фундаментальная модель для временных рядов и как ее (не) обучать на синтетике

Темирханов А. А., Костромина А. М., Цымбой О. А. и др., Доклады Российской академии наук. Математика, информатика, процессы управления (ранее - Доклады Академии Наук. Математика) 2025 Т. 527 № S С. 485–494

В индустрии нередко возникает необходимость одновременно строить прогнозы по большим наборам временных рядов. Однако мы можем оказаться в ситуации, когда обучение отдельной модели для каждого из них невозможно или слишком затратно. Эта проблема в моделировании временных рядов остается без должного внимания. Средством ее решения может служить создание фундаментальной модели (foundation model), рассчитанной на прогнозирование в ...

Добавлено: 24 февраля 2026 г.

AGDES: a Python package and an approach to generating synthetic data for differential equation solving with LLMs

Vladimir Zakharov, Anton Surkov, Sergei Koltcov, Procedia Computer Science 2025 Vol. 258 P. 1169–1178

Добавлено: 21 августа 2025 г.

Sim4Rec: Flexible and Extensible Simulator for Recommender Systems for Large-Scale Data

Anna Volodkevich, Ivanova V., Васильев А. В. и др., , in: Advances in Information Retrieval: 47th European Conference on Information Retrieval, ECIR 2025, Lucca, Italy, April 6–10, 2025, Proceedings, Part IV.: Springer, 2025. P. 425–430.

Добавлено: 10 апреля 2025 г.

User response modeling in recommender systems: a survey

M. Shirokikh, Shenbin I., Alekseev A. и др., Journal of Mathematical Sciences 2024 Vol. 285 No. 2 P. 255–284

Добавлено: 24 ноября 2024 г.

MedSyn: LLM-based synthetic medical text generation framework

Kumichev G., Blinov P., Kuzkina Y. и др., , in: Machine Learning and Knowledge Discovery in Databases. Applied Data Science Track. European Conference, ECML PKDD 2024, Vilnius, Lithuania, September 9–13, 2024, Proceedings, Part X. LNCS, volume 14950.: Cham: Springer, 2024. P. 215–230.

Добавлено: 22 ноября 2024 г.

The Role of Synthetic Data in Improving Neural Network Algorithms

Rabchevskiy A., Leonid N. Yasnitsky, , in: 2022 4th International Conference on Control Systems, Mathematical Modeling, Automation and Energy Efficiency (SUMMA).: IEEE, 2022. P. 316–312.

Добавлено: 15 февраля 2024 г.

Creating and Using Synthetic Data for Neural Network Training, Using the Creation of a Neural Network Classifier of Online Social Network User Roles as an Example

Rabchevskiy A., Ясницкий Л. Н., , in: Digital Science: DSIC 2021Vol. 381.: Switzerland: Birkhauser/Springer, 2022. P. 412–421.

Добавлено: 14 февраля 2024 г.

Исследование применения методов машинного обучения в задаче выявления мошеннических действий в отношении клиентов банка при подтверждении операции

Шелепова А. Н., Воробьев И. А., В кн.: Межвузовская научно-техническая конференция студентов, аспирантов и молодых специалистов им. Е.В. Арменского 2023.: МИЭМ НИУ ВШЭ, 2023. С. 289–292.

На сегодняшний день выявление мошенничества в банковской сфере значительно затруднено из-за применения злоумышленниками методов социальной инженерии. Мошенники обманывают клиентов и убеждают перевести денежные средства на свои счета под различными предлогами. В целях противодействия угрозе банки блокируют операции и обращаются к клиенту для дополнительного подтверждения. Находясь под психологическим воздействием злоумышленников, клиенты подтверждают операции, несмотря на предупреждения ...

Добавлено: 13 февраля 2024 г.

Synthesis of Datasets for Neural Networks Based on Expert Knowledge

Rabchevskiy A., Ashikhmin E., Ясницкий Л. Н., , in: Cyber-Physical Systems and Control II.: Springer, 2023. P. 535–544.

The problem of creating datasets for training and testing neural networks is described in the example of the task of social network management. A method of expert dataset synthesis based on experts’ knowledge of the subject area is proposed. The essence of the method lies in the fact that sets are generated randomly within the ...

Добавлено: 20 ноября 2023 г.

МОДЕЛИ ПРОГНОЗИРОВАНИЯ ВЕРОЯТНОСТИ БАНКРОТСТВА И ВОЗМОЖНОСТИ ИХ ПРИМЕНЕНИЯ ДЛЯ СТРОИТЕЛЬНЫХ КОМПАНИЙ

Войко А. В., Учет. Анализ. Аудит 2021 Т. 8 № 1 С. 13–23

В статье анализируются зарубежные и отечественные методики прогнозирования банкротства предприятий с целью их применения в крупнейших организациях России. Эмпирической базой исследования явились строительные компании, сопоставимые по размеру, объемам выручки, доле рынка, а информационной базой для расчетов послужили данные их финансовой отчетности за год, предшествующий анализу. Качество прогнозов проверено на основе расчета независимых показателей финансового анализа, ...

Добавлено: 2 ноября 2021 г.

Качество риск-менеджмента в банке: предпосылки возникновения финансовых проблем

Хасянова С. Ю., Цыганова В. В., Российский журнал менеджмента 2018 Т. 16 № 2 С. 187–204

Наблюдающееся в последнее время существенное сокращение числа банков в РФ и возникающие в связи с этим высокие общественные издержки по ликвидации и санации вызывают необходимость непрерывного совершенствования систем раннего предупреждения банкротств. Статья посвящена выявлению опережающих индикаторов финансовой несостоятельности, используемых регулирующими органами при оценке экономического положения банков. Исследование проведено на выборке из 49 банков кластера средних ...

Добавлено: 9 октября 2018 г.