前不久有朋友问我现在大多时间看什么网站,仔细想想之后,发现自己的读网行为完全没有规律。以前基本看门户站和几个圈子的BBS,现在大部分时间看订阅的RSS,一是懒了,再是事多,只想阅读自己愿意去信任的信息源,那些热闹的门户和社区,充满了真假莫辩的“营销”内容。
从很久以前开始,我有一个梦想,那是关于一种智能信息处理的技术,它能够日以继夜地在网络上搜集所有我关心的信息,然后分类。同时学习我的阅读 习惯,给收集回来的信息做轻重缓急的标签处理,最紧急的甚至能够打手机把我叫醒。当然,它要智能得知道那个打电话的时间不会导致我摔手机,或者就是这个智 能已经进化到了能够在跟手机有仇的情况下故意嫁祸。
数据挖掘研究院
智能信息处理的重要性人尽皆知,现在不但信息冗余太厉害,再者,被“大客户”干预的内容不少,道德底线在地核之下的搜索结果也更多,没有经过处 理就汹涌过来的信息不但没有用,反而成为负担。而在海量信息中进行有效筛选,总能避开暗礁,钓起苏眉,肯定不是人干的活。谁干?我觉得GOOGLE目前最 有希望往这个方向进化,而且有可能解决全球准则和部分特殊国情的某些矛盾,比如私人化的信息不是公共信息,不需要按照“大客户”的要求进行屏蔽,也不会产 生相关的风险。 数据挖掘交友
最好不要让GOOGLE的人认识你,他们出现在任何SNS的好友推荐里,也千万不要加。这样的话就可用掩耳盗铃的心态登录ID后再使用他们家的 服务,比如搜索,让GOOGLE保留搜索历史,同时在GMAIL里面收一些关键词邮件,尽量教会GOOGLE明白平时你都关心些什么。接着大胆在 READER里面订阅你手工能够找到的心水RSS,比如AV指南,性感美女之类的……其实我不是G粉,举他为例仅仅有两个可怜的原因,一个是目前只有他流 露出这种欲望,作出一股贴身服务的姿态,想着让我们尽量把隐私数据给他,根本没有第二个类似可选的;二是好歹他有不作恶的道德承诺,其他企业有谁做出类似 的承诺吗?承诺不一定有用,可是有总比没有强。这从另外一个角度说明了为什么我们都很容易被骗,到底是坏人太多,一个自称的不作恶就能打动我们。 数据挖掘工具
事实上,尽管GOOGLE已经收集和分析了我那么多行为,只停留在为收集而收集,不但还没有智能,连一般的数据挖掘都显得很傻瓜,希望其进化第 一步,在READER里给我推荐的RSS能否更加靠谱些?现在推荐过来的,基本上同义反复,配对下关键词或者标签就塞过来,我要的就是有人帮我选,而不是 来添乱的好不好。比如,要根据我的高尚品味,提供更清凉更漂亮的图片视频什么的,这可以在我不断地取舍之后,逐步认识到我的审美高度啊。其实,如果结合搜 索所用关键词和GMAIL,READER可以做得更好,莫非不同业务之间的数据共享因为有大公司病而做不到?
数据挖掘交友
当然,现在所有这些可能的处理,只是很初级的数据挖掘,跟智能代理一点边都挂不上。人工智能,目前毕竟属于科学研究范畴而并非商业应用范畴,把 希望寄托在一个公司上面应该还是不靠谱。这里我所指的科学研究范畴意思是专门搞不靠谱的事情,商业应用就是可以计划能够赚钱的差事。想到这里,一声叹息。
数据挖掘实验室
突然想起朋友讲过的一个故事,说遇到某个老一辈程序员,想拍下马屁就称呼对方叫做第一代程序员,结果对方非常不爽,他坚持说自己是科学家。
人工智能的算法,至今还是难题,我想,有能力并愿意面对这个困境试图去解决的,就是真正的科学家。更愿意面对人民币的话,还是做一个程序员为 妙,哪怕只是做一个火星文输入法,现在也有人使用的,搞不好还能发展成木马什么的,就算危机来了没事干,还可以去盗些各种各样的号来卖一卖。