Доброчанька 04/04/2023 (Tue) 22:08 No.3512 del
>>3496
Собственно, самое интересное-то я и не сказал о современных Actor-Сritic системах. GPT-4 показала, что с монолитной моделью можно получить хорошие результаты, просто побуждая её критиковать саму себя, и это даёт качественно лучший файнтюн, чем то, что я показывал с LLMs can self-improve.

https://nanothoughts.substack.com/p/reflecting-on-reflexion
https://evjang.com/2023/03/26/self-reflection.html
https://newatlas.com/technology/gpt-4-reflexion/

Скорее всего, эта способность будет доступна и другим моделям такого уровня.

Обрати внимание, она недоступна Кальсону, я ему указал на то, что он потерял категорию воображаемых индусов, но он лишь больше распетушился.