Комплексная оценка больших языковых моделей для медицинских задач с помощью MedHELM.

Абстрактный Хотя большие языковые модели (LLM) показывают почти идеальные результаты на экзаменах по лицензированию медицинских…