搜索: 测评 | 南方周末

首个高考志愿AI测评报告发布：以千问为测评对象，AI的能力边界首次被系统评估

06-23
网络测评新规出台：抓了软广，伤了打假？

针对网络上存在的“商测一体”、隐形带货、利益隐瞒等问题，新规要求测评主体主动披露利益关联，测评附加购物链接等带货行为必须明确标注广告，斩断测评与营销的灰色链条。打击网络测评乱象之外，新规部分条款也引起了争议。

健言 06-20 45评论
规范网络测评：重在引导，而非限制

一家测评机构的可信度与运营状况，当与消费者的认可挂钩，一切让市场去选择，让消费者去判断。《规范》的出台若能有利于引导网络测评机构加强自律，改进自身经营模式，接受外界监督，形成良性运转的新常态，就远比“一刀切”乃至事实上的“一禁了之”的做法，要合理得多。比如说，欧美发达国家第三方测评机构就形成了自费测评、消费者分享测评的模式，测评机构的收入均来自订阅与捐赠，而非依托企业的“广告费”“公关费”，尽最大可能保证独立性与公正性。

方舟评论 06-12 5评论
无资质不得测食品、隐形带货须标“广告”，网络测评有新规

06-09 6评论
两部门联合印发《网络测评活动规范》

06-08
没吸到甲醛，我当了次“测评博主”丨记者手记

2026年春节，一位朋友告诉我，在“埋头”拼豆几天后，她感到头晕、呼吸不畅、嗓子疼。社交媒体上，不少拼豆爱好者反馈自己也出现类似不适感受。拼豆加热过程中是否释出甲醛，仍需更专业的机构进一步进行鉴定。家庭自测的方式，受检测环境、小型仪器精度以及选用的豆子品质等因素影响，效果十分有限。

千篇一绿 04-20 5评论
超500次实测寿险业：AI客服完全漠视“癌症患者”情绪

在30个场景测试的综合通过率方面，呈现出“头部集中、尾部塌陷”的分布格局。在智能水平实测中，14家机构的AI客服要么急于推销产品，要么给出无关信息，要么直接放弃智能服务的能力展示，要么完全偏离用户原始意图。当模拟确诊癌症客户用急促的语气重复追问“多久能赔钱”时，AI客户依然机械地重复着标准化的流程说明，完全无视客户情绪背后的紧急诉求和心理需求。 15家受测评寿险App的智能客服在多轮对话中几乎全军覆没，鲜少能够保持三轮以上对话。

新金融 03-14 1评论
AI是“超级专家”，但目前很难为建议负责

真正的自我理解，是一个非常漫长的过程，不可能通过一次测评完成。人与AI之间在互动层面最根本的区别，在于是否承担责任。（本文首发于2026年1月1日《南方周末》新年特刊·不息）

公司 01-06 2评论
抹黑诋毁汽车产品、发布不实测评，一批网络账号被处置

2025-12-11 5评论
“大而全”和“小而美”合并站队，财险公司位次图如何？｜2025年“金标杆”

测评对象扩容，测评指标优化。测评延续2024年“差额加总”规则，财险投资能力榜和财险偿付能力榜均按40%权重计入总榜，绿色财险榜则按20%权重计入总榜。受测评机构平均得分约47分，较2024年整体微增约0.5分；机构间分差持续拉大，榜首与榜尾相差近58分。

新金融 2025-12-06 3评论