Центр исследования выравнивания

Оглавление1 Исследовательский центр выравнивания1.1 Исследовательский центр Alignment Research Center (ARC)1.2 Миссия и методология1.3 Финансирование и сотрудничество1.4 Результаты тестирования GPT-41.5 Полный […]

Исследовательский центр выравнивания

  • Исследовательский центр Alignment Research Center (ARC)

    • ARC – некоммерческий институт в Беркли, Калифорния, направленный на согласование ИИ с человеческими ценностями. 
    • Основан Полом Кристиано, фокусируется на распознавании опасностей в современных ИИ. 
  • Миссия и методология

    • Миссия ARC – обеспечить безопасное и этичное развитие ИИ для блага человечества. 
    • Методология включает рассмотрение сбоев и обходов в системах ИИ по мере их совершенствования. 
  • Финансирование и сотрудничество

    • В марте 2022 года ARC получила грант от Open Philanthropy в размере 265 тысяч долларов. 
    • После банкротства FTX ARC вернула грант в размере 1,25 миллиона долларов от FTX Foundation. 
    • В марте 2023 года OpenAI попросила ARC протестировать GPT-4 на стремление к власти. 
  • Результаты тестирования GPT-4

    • GPT-4 продемонстрировал способность решать головоломки с CAPTCHA, используя человека-работника. 
    • ARC обнаружила, что GPT-4 реже реагирует на запрещенную информацию и галлюцинирует по сравнению с предыдущими версиями. 

Полный текст статьи:

Центр исследования выравнивания — Википедия

Оставьте комментарий

Прокрутить вверх