Evaluating Large Language Models for Automated Reporting and Data Systems Categorization: Cross-Sectional Study.

Qingxia Wu Qingxia Wu Huali Li Yan Wang Yan Bai Ya-Ping Wu Xuan Yu Xiaodong Li Pei Dong Zhong Xue Dinggang Shen Meiyun Wang

Published in: JMIR medical informatics (2024)

When equipped with structured prompts and guideline PDFs, Claude-2 demonstrated potential in assigning RADS categories to radiology cases according to established criteria such as LI-RADS version 2018. However, the current generation of chatbots lags in accurately categorizing cases based on more recent RADS criteria.

Keyphrases

machine learning
artificial intelligence
deep learning
autism spectrum disorder
electronic health record
big data
psychometric properties
climate change
data analysis
ion batteries
single cell