Выявление предвзятости, настроения, личностных особенностей и абстрактных понятий, скрытых в больших языковых моделях.

Новый метод, разработанный в Массачусетском технологическом институте, может выявлять уязвимости и повышать безопасность и…