-
首个高考志愿AI测评报告发布:以千问为测评对象,AI的能力边界首次被系统评估
-
网络测评新规出台:抓了软广,伤了打假?
针对网络上存在的“商测一体”、隐形带货、利益隐瞒等问题,新规要求测评主体主动披露利益关联,测评附加购物链接等带货行为必须明确标注广告,斩断测评与营销的灰色链条。 打击网络测评乱象之外,新规部分条款也引起了争议。 -
规范网络测评:重在引导,而非限制
一家测评机构的可信度与运营状况,当与消费者的认可挂钩,一切让市场去选择,让消费者去判断。《规范》的出台若能有利于引导网络测评机构加强自律,改进自身经营模式,接受外界监督,形成良性运转的新常态,就远比“一刀切”乃至事实上的“一禁了之”的做法,要合理得多。比如说,欧美发达国家第三方测评机构就形成了自费测评、消费者分享测评的模式,测评机构的收入均来自订阅与捐赠,而非依托企业的“广告费”“公关费”,尽最大可能保证独立性与公正性。 -
无资质不得测食品、隐形带货须标“广告”,网络测评有新规
-
两部门联合印发《网络测评活动规范》
-
没吸到甲醛,我当了次“测评博主”丨记者手记
2026年春节,一位朋友告诉我,在“埋头”拼豆几天后,她感到头晕、呼吸不畅、嗓子疼。社交媒体上,不少拼豆爱好者反馈自己也出现类似不适感受。 拼豆加热过程中是否释出甲醛,仍需更专业的机构进一步进行鉴定。家庭自测的方式,受检测环境、小型仪器精度以及选用的豆子品质等因素影响,效果十分有限。 -
超500次实测寿险业:AI客服完全漠视“癌症患者”情绪
在30个场景测试的综合通过率方面,呈现出“头部集中、尾部塌陷”的分布格局。 在智能水平实测中,14家机构的AI客服要么急于推销产品,要么给出无关信息,要么直接放弃智能服务的能力展示,要么完全偏离用户原始意图。 当模拟确诊癌症客户用急促的语气重复追问“多久能赔钱”时,AI客户依然机械地重复着标准化的流程说明,完全无视客户情绪背后的紧急诉求和心理需求。 15家受测评寿险App的智能客服在多轮对话中几乎全军覆没,鲜少能够保持三轮以上对话。 -
AI是“超级专家”,但目前很难为建议负责
真正的自我理解,是一个非常漫长的过程,不可能通过一次测评完成。 人与AI之间在互动层面最根本的区别,在于是否承担责任。 (本文首发于2026年1月1日《南方周末》新年特刊·不息) -
抹黑诋毁汽车产品、发布不实测评,一批网络账号被处置
-
“大而全”和“小而美”合并站队,财险公司位次图如何?|2025年“金标杆”
测评对象扩容,测评指标优化。 测评延续2024年“差额加总”规则,财险投资能力榜和财险偿付能力榜均按40%权重计入总榜,绿色财险榜则按20%权重计入总榜。 受测评机构平均得分约47分,较2024年整体微增约0.5分;机构间分差持续拉大,榜首与榜尾相差近58分。