社交媒体正在毁掉内容沉淀

业界 2018-11-02 12:08:23 阅读329

　　博客和论坛作为曾经的互联网主流应用正在日益迈向死亡，新型的社交媒体和社区正在逐渐兴起。社交网站（或者说媒体）以时间流为主要呈现形式，以关系和兴趣模型作为内容筛选机制，让用户能够更加及时更加准确的获取自己想要的信息，也让网络上信息的传播广度和传播速度比以往任何时候都要快。

　　但是，当所有信息以动态的形式在网上传播时，人们就很难再抓住其中某些有价值的信息使其沉淀下来。久而久之，甚至会演变成对历史信息的不可寻。

　　 内容沉淀的头号杀手——时间流

　　时间流的好处是可以将个性化阅读融入其中，其实传统的互联网组织形式也类似于时间轴（如 Google Reader 的全部文章页面）。但社交媒体的时间流与博客和 RSS 的区别在于时间流几乎是社交媒体的全部。

　　Twitter 一直希望将自己定位成一种新型的媒体，而这种媒体本身并不存储任何长内容和图片，仅提供 140 个字的文字描述。对于大多数的用户来说，140 个字的描述足以了解事件的时间、地点、人物和主要内容。但是，这并不意味着时间发生的原因、后果、影响和背景就不重要了。

　　但是，如果将详细的内容全部都插入到时间流中，就会使得时间流变得拥挤不堪。在新浪微博上大为流行的长微博模式更是一种对索引不友好的形式，它阻碍了信息从图片内到图片外的流通。

　　因此，我们可以认为所有以时间流为组织形式的社交媒体其存在的价值就是让信息流动起来。

　　这种理念与“沉淀”本身就存在着矛盾，因此为社交媒体与“内容沉淀”之间的种种冲突奠定了基础。

　　不过，时间流并不是最糟糕的部分，起码我们还可以针对发布者、信息类型（图片、日志、状态）和时间进行筛选。在国内，一个更糟糕的叫做“微信公众平台”的东西正在崛起。

　　人际关系模型阻碍信息索引

　　主流的社交媒体仍然维持在以关注或双向关注的方式对时间流上的内容进行筛选，这样造成的效果就是那些从用户时间流里滑出去的信息对用户来说就再也不存在了。

　　这不是危言耸听，如果社交媒体平台允许，你可以很容易的找到某个人在过去某一时间点上所发布的信息（如新浪微博个人微博搜索）。但是，你却无法还原那个时间点上当时的时间流所呈现的内容。

　　举一个简单的例子，2013 年 4 月 16 日上午，新浪微博被两件事所覆盖：波士顿爆炸案和复旦大学投毒案。设想一年后的今天，你想要从中筛选出某些有价值的内容和有价值的人要怎么做？

　　一种方案是预期选定某些有价值的人，如李开复、姚晨、作家崔成浩等微博大咖，然后去他们的个人页面搜索相关的微博。另一种方案是在微博搜索中选择高级搜索然后划定一个时间范围，然后通过关键词进行检索。

　　现实是，这两种方案都不能给出令人满意的答案，前者要求用户事先预测好哪些用户有可能发布过具有价值的信息，而后者受到新浪微博搜索系统的限制，几乎会被淹没在信息噪音里。

　　 传统互联网是一片海，社交媒体是内陆湖

　　搜索引擎的出现改变了人们对互联网使用的概念，Google 在建立之初致力于检索整个互联网上的全部信息（事实上现在也是如此）。在社交媒体出现之前，网上有两类网页：一种是允许搜索引擎检索的，这类网页可以被所有人轻易的找到。另一种是网页发布者禁止被搜索引擎检索的，这类网页通过登录权限或 Robot.txt 禁止搜索引擎检索收录。

　　而在社交媒体出现后，一切都变得暧昧起来。虽然很多人在社交媒体上发布的消息是公开的，但社交媒体本身作为一个统一的内容载体对外部搜索可以说一点都不友好。

　　到现在为止，Google 仍然只是简单的将 Twitter 和 Facebook 网站上那些公开的页面纳入自己的索引，然后与普通的页面一起呈现在搜索结果中。这是完全不够的，类似 Facebook 这样的网站，由于其大部分内容拥有隐私权限设置，即便是对于那些公开的日志和图片，也很难以 PageRank 来判定网页的价值。举个简单的例子，也许一篇公开的日志有很高的价值（用户判定，如收获了很多赞），但链接到该文章的外链（Facebook 站内分享）都因为隐私而被添加了 noindex 和 nofollow 标签（不索引，不爬过），那么就会造成搜索引擎对网页价值的误判。

　　因此，搜索引擎如果希望能够真正对社交媒体建立起有效的索引，必须与社交媒体本身有数据上的合作，基于 Facebook 的赞和评论，Twitter 的转发记录才能更加准确的判断内容的价值。Google 曾在 2009 年推出了针对于 Twitter 的即时搜索，随后 Facebook 也加入其中，两年之后他们之间的合作协议到期了。然后，就没有然后了。

　　无论是国外的 Facebook Twitter 还是国内的人人网和新浪微博，似乎都更倾向于将搜索业务包含在自己的平台内，对外部搜索充满敌意。这样结果是用户为了检索他们内部的信息，必须逐一的登陆他们自己的搜索系统。

　　而他们自己的搜索系统体验如何？

　　 信息噪音成倍增加

　　社交媒体前所未有的让每一个人拥有和传统媒体同等的发声权，但是这种“权力”上带来的平等却并没有同时给予义务上的保证。每一个用户都有权力发布内容，但是并不是所有人都能发布有价值的内容。而事实上，大多数人发布的内容在自己不相关的人来说毫无价值。而这些内容如果是公开的，那么会一并进入公共信息频道，与那些有价值的内容混合在一起为检索、分类、二次筛选和沉淀做出妨碍。

　　事实上，刚刚发生的 4·16 波士顿爆炸案也恰恰说明了这一点，外国评论认为：“Twitter 在灾难发生后的头五分钟效果最好，但 12 小时后效果最差。”

　　其原因在于社交媒体使得每个人都变成自媒体，保证了整个社交媒体平台对此类重大事件的最快响应速度。但是当每个自媒体都在简单重复的报道同一内容的时候，重要的、有价值的、有深度的信息就会被掩埋。

　　 对良好用户习惯被破坏

　　当 Twitter 和 Facebook 替代 Google 成为互联网入口之后所带来的影响远非停留在内容索引和分类，甚至对用户习惯也影响深远，而这里要说的当然是坏的改变。

　　古人有云：敏而好学，不耻下问。

　　而在互联网时代，在没有做到“敏而好学”的前提下“不耻下问”是一种十分没有礼貌的行为。早在 2006 年，著名计算机程序员，开源软件运动旗手埃里克·史蒂文·雷蒙德就整理过一篇名为《提问的智慧》的文章。

　　在文章中，“提问前”一节，他给出如下建议。

　　原因在于不论是十年前的论坛也好，还是现在的社交媒体也好，如果你将你的发布窗口当作搜索窗口来使用——任何问题都第一时间在社交媒体上发布“为什么……？”“哪里有……？”“怎么办……？”而不是去自己搜索一下答案。那么你浪费的不仅仅是自己的时间，而且也是所有看到这条信息的人的时间。

　　这些重复的提问和重复的回答（假设有人回答）也会进一步加强信息噪音对价值内容的干扰。

　　然而，由于社交媒体的兴起，这样“不耻下问”（贬义）的用户正在变得越来越多。这大概也是 LMGTFY（让我帮你 Google 一下）这个网站仅凭一个简单的动画就成为全球排名 8000 网站的原因。

　　即便如此，我们不能否认社交媒体在互联网信息传播中的重要性。但需要注意的是无论是社交媒体还是搜索引擎都必须重视这个问题，就像 CCTV 教导我们的那样：“先建设，后治理的路子是不行滴~”

　　图片源：