Denys Linkov提出了一个构建微观指标的框架,用于评估LLM系统,重点关注以用户为中心和迭代的方法,以衡量性能、可靠性和改进。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
@
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。