Central European News in Chinese – 中欧与世界新闻 – 中欧社

何三畏:我想学习一下“敏感词”

“敏感词”终于成为一个可以公开报道的内容。当我看到搜狐网转载北京日报的报道《搜狐严格过滤不健康内容,每天屏蔽五千微博》时,我深感好奇。”敏感词”使用多年,使”敏感词”这个词本身,变得不再敏感,尽管”敏感词”都是什么样子,都长在什么部位,仍然不得而知。这就像”网络评论员”(俗称”五毛”)这一个工作或职业,也逐渐变得可以公开谈论,并出现在网络里,写在报纸上,但谁是”网络评论员”,仍然没有人知道。

我想,这样的潜规则的公开,对于网络公司来说,意味着什么呢?现在的企业爱美誉自己为”企业公民”,表示一个有道德人格的主体。那么,网络公司会不会为过去长期使用”过滤词”这一不公开的暗器对付网民而不好意思呢?而这一消息来自北京日报,北京日报应该是很政治主流和政治正确的报纸。它的报道应该有道理。再查,看到搜狐网络自己把它放在显眼位置,还在论坛里作为网民讨论的话题。这说明作为事主,网络公司认为这是光明正大的,视为表扬自己的”正面报道”的。

根据报道,这些”敏感词主要是涉枪、涉黄、涉暴”。”每天屏蔽五千微博”,差不多每十四五条当中,就有一条”不健康”。这真叫人伤心。一但”严格”起来,微博就显得这么黄色和暴力。这么看来,喜欢上微博的人,思想也太”不健康”了。可是,微博不是这个时代最有知识,最有判别力的人在玩吗。如果他们是如此”不健康”,那么,不意味着我们这个社会,或者说我们这个民族的素质”不健康”吗。或者,是否也说明网络公司”太严格”,敏感词”太敏感”了,才得出这个”不健康”的诊断呢?

“敏感词”的真容还在敏感中,不能依据它来做评论。但是,它的数量,”主要是涉枪、涉黄、涉暴”的敏感词即有1000多个,这可能太多了,会给微博写作带来极大的麻烦。微博使用的语言是简单的,基本上应该在两千多个不同汉字的范围,而从中又去掉了1000多个字、词或词组,难怪帖子那么容易被过滤。令人困惑的是,汉语词典里涉枪、涉黄、涉暴的字词应有尽有,假如某微博抄一段而被过滤掉,是否意味着对不起我们的文化?

这里必然产生两个问题。一,为什么需要”敏感词”,它们是怎么产生的,有没有合法的途径?二,如果需要而且合法地产生了”敏感词”,那么,应该怎样使用。很显然,它应该成为”上网须知”,最好是放在网上供网民学习。规定不能背诵60%以上,不能开机。一旦有新的”敏感词”产生了,还要及时增录,广而告知。本人上网的时间不多,但偶尔也被过滤。可是,我自认为我既不黄,也不暴,简直不明白什么原因。所以,我迫切需要学习掌握”敏感词”。

(中国新闻周刊)