В Tinkoff Research оптимизировали алгоритм для обучения ИИ
В Tinkoff Research заявили, что создали самый эффективный среди мировых аналогов алгоритм для обучения и адаптации искусственного интеллекта. Новый метод, названный ReBRAC (Revisited Behavior Regularized Actor Critic — пересмотренный актор-критик с контролируемым поведением), обучает ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов в области обучения с подкреплением (Reinforcement Learning, RL), адаптируя его к новым условиям «на лету».