如何评价《人民日报》于 10 月 5 日发表的《不能让算法决定内容》?
《人民日报》(4 版)10 月 5 日发表题为《不能让算法决定内容》的文章。文章称,随着大数据、人工智能的广泛应用,一些商业网站、移动新闻客户端,都在运用算法这个「读心术」。文章指出,技术往往是一把冷冰冰的双刃剑,在价值和利益的天平上,所谓的算法成为了利益的砝码。一切围着流量转,唯点击量、转发量马首是瞻,「标题党」泛滥,价值取向跑偏,内容沦为附庸。
文章认为,算法不是王法,算法决定内容更不是王道。只有算法回归到服务内容的角色,变得有态度、有深度、有温度,才能让人们在信息的海洋里尽情遨游、在清朗的环境中自由飞翔,才能使网络空间碧波荡漾,激发出源源不断的正能量。
不吹不黑。只从技术角度来看,《人民日报》这篇文章也提到了一个很有意义的问题,那就是信息化时代我们很容易在不知不觉中被推荐内容“洗脑”。在现有技术手段下,适当引入人工筛选可以遏制一些有害行为,如软文推广、诈骗信息、虚假新闻等。
简单的科普一下媒体流常用的推荐算法:
在新用户注册时,你会被要求填写一些感兴趣的话题,作为初始“种子”进行文章推送。比如你表明你对篮球感兴趣,那么你的首页有很大比例都是篮球相关。
随着你的浏览量上升,比如关注了不同媒体或者大量浏览某个话题的文章以后,平台就会提高这类内容的占比。比较传统的协同算法,就是找到和你兴趣相似的人并把他们的浏览内容推荐给你,或者和当前文章相类似主题的文章。
当你看的文章越来越多,风格越来越鲜明以后,你的账户会被打上一些“标签”,对你的浏览爱好进行分类。有时候有社交属性的网站还会把使用者进行网络化/图谱化分析,加强推荐的准确性。
1. 推荐算法有什么问题?
你只能看到特定的话题,很难跳出这个信息圈。而这种效应会不断加强,时间久了容易一叶障目不见泰山。普通用户感兴趣的话题还是以生活、娱乐为主,导致其他有意义内容的生存空间比较小。不难发现,信息分发平台的每日推送头条常常是以明星八卦为主。慢慢的,你发现你对每个明星的行程了如指掌,但并不知道原来自动驾驶汽车已经上路实验好几年了。
很多网站试图加入一些“创新元素”,比如也会推荐“你可能对XXX感兴趣”。但往往这类帮助用户跳出“舒适圈”的信息流都很难引起大家的兴趣,还往往被用户批判一番。于是,最终能存活在大量用户时间线上的信息就主要是吸引眼球的爆款文了。这不仅促进了“标题党”和“博眼球”,也使得用户的精力花在了没有营养的内容上。
2. 如何利用推荐算法“作恶”?
对于推荐系统的依赖也给了别有用心的人发挥空间。大部分平台的推荐内容中都有一些难以分辨的广告推广、高级软文、甚至诈骗等。比如,一篇介绍中老年疾病的科普文章最后变成了销售保健品,可谓防不胜防。这可能是因为平台技术能力不足,也有可能是装作看不见甚至推波助澜,毕竟最后可以把锅推给算法。推荐系统不仅可以计算出推荐什么内容,也可以推测你适合的广告有哪些。即使不用算法推荐,人工推荐其实早就出现在了分发平台上,只不过更多的用在了商业推广上。
因此,标榜推荐算法的平台也有“作恶”的权力,比如慢性洗脑。请相信潜移默化的力量,慢慢的你会以为这些软文这是自己想看的内容,可能还在现实生活中购买了相关的产品。
3. 如何平衡推荐算法和人工筛选?
在法律法规和技术能力的双重限制下,不妨这么想:
站在官方角度考虑,建议将现在百分之二十的推荐文章替换为“我们需要阅读的文章”,比如“两学一做”等主旋律文章。很多平台,比如澎湃早就走了这个路线。这部分文章由编辑/运营手动选择,推荐给所有用户并关闭评论。在将来,或许当地政府选择“适合当地人民的内容”...这是时代的选择,我们都无可选择。
站在个人用户的角度,建议将系统推荐中百分之二十替换成“开阔眼界”的文章,比如前沿科技、艺术赏析、文化历史等。在比例不高不引起用户反感的前提下,尝试给用户提供一些不同的内容。
人工筛选也应该被用在识别“有害的内容上”,处理那些算法无法识别的恶意信息。很多高级的推广写的极具迷惑性,现在的语义分析能力并不能很好的区分出来。虚假新闻也很难依靠算法识别,这也是编辑/运营可以手动检索的内容之一。
科技企业也需要提高自己的业务道德。不是每一种钱都可以赚,人血馒头不能吃。如果明知是恶意信息但因为有利益原因还是将其推荐给用户,我宁可我们没有先进的技术。那些因为科技公司作恶而倾家荡产甚至失去生命的人的名字并没有远去,只是很容易被遗忘。内容推荐、新闻推送只不过是不同平台上的另一个应用,而类似的悲剧已经够多了。
4. 如果我不喜欢推送或者不愿意被“洗脑”怎么办?
技术宅建议还是选择自己订阅感兴趣的主题如RSS,或者写爬虫从特定站点收集自己感兴趣的话题。依赖于主流媒体的内容推送,不管是人工还是系统推荐,或多或少对会被洗脑。“定制化”和“效率”很难兼得。你如果要节省时间从平台处吸收资讯,就得接受他们“强奸”你的思想。
5. 这篇文章对于我们有什么启发?
换个角度看,这篇文章无心插柳地给普通大众提了个醒,要对于科技发展和技术公司保持警惕。大部分用户已经把安全和隐私完全交给了科技公司,现在连自己能看到什么也交了出去,这是无奈但正在发生的事情。过去短短几年,我们已经见识了多少科技公司做过的“恶”。
“民主”和“自由”本身就是对立的。问题的核心还在于提高分发平台的商业道德和技术能力,以及用户的阅读分辨能力。在短时间内,这两件事都不会发生,所以增加人工推荐的比例也不完全是个坏点子。我不反对利用人工筛选来增加些“主旋律内容”,但也希望增加一些“拓展眼界”的文章,并利用人工来减少一些迷惑性强的有害内容。
退一步说,大时代下没有人能独善其身,这也只是个开始而已 ʕ* ᴥ* ʔ
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21大数据技术专业主要学习计算机科学、数学、统计学和信息技术等领域的基础理论和技能,旨在培养具备大数据处理、分析和应用能力的 ...
2024-11-21《Python数据分析极简入门》 第2节 3 Pandas数据查看 这里我们创建一个DataFrame命名为df: importnumpyasnpi ...
2024-11-21越老越吃香的行业主要集中在需要长时间经验积累和专业知识的领域。这些行业通常知识更新换代较慢,因此随着年龄的增长,从业者能 ...
2024-11-20数据导入 使用pandas库的read_csv()函数读取CSV文件或使用read_excel()函数读取Excel文件。 支持处理不同格式数据,可指定分隔 ...
2024-11-20大数据与会计专业是一门结合了大数据分析技术和会计财务理论知识的新型复合型学科,旨在培养能够适应现代会计业务新特征的高层次 ...
2024-11-20要成为一名数据分析师,需要掌握一系列硬技能和软技能。以下是成为数据分析师所需的关键技能: 统计学基础 理解基本的统计概念 ...
2024-11-20是的,Python可以用于数据分析。Python在数据分析领域非常流行,因为它拥有丰富的库和工具,能够高效地处理从数据清洗到可视化的 ...
2024-11-20在这个数据驱动的时代,数据分析师的角色变得愈发不可或缺。他们承担着帮助企业从数据中提取有价值信息的责任,而这些信息可以大 ...
2024-11-20数据分析作为现代信息时代的支柱之一,已经成为各行业不可或缺的工具。无论是在商业、科研还是日常决策中,数据分析都扮演着至关 ...
2024-11-20数字化转型已成为当今商业世界的热点话题。它不仅代表着技术的提升,还涉及企业业务流程、组织结构和文化的深层次变革。理解数字 ...
2024-11-20在现代社会的快速变迁中,选择一个具有长期增长潜力的行业显得至关重要。了解未来发展前景好的行业不仅能帮助我们进行职业选择, ...
2024-11-20