亚马逊(Amazon)的强大的数据挖掘和分析

我们都知道Facebook、谷歌以及苹果等公司十分了解用户。事实上,亚马逊可能更胜一筹。这家零售巨头每天都在证明这一点。市场调研公司的数据显示,亚马逊网站推荐的销售转化率可以高达60%。而这些都基于对用户数据的挖掘和分析。

当亚马逊(Amazon)在网站上向你推荐商品时,它绝非无的放矢。

从根本上讲,这家零售巨头的推荐系统推荐的基础是一系列基本元素:用户过去购买过哪些商品;他们的虚拟购物车里有什么;哪些商品被他们评价或“赞”过;其它用户浏览及购买了哪些东西。亚马逊把这套自主研发的算法称为“从项目到项目的协同过滤算法”。依靠这套算法,亚马逊向回头客们提供了深度定制的浏览体验。数码爱好者们会发现亚马逊上满是新潮电子产品的推荐,而新妈妈们在相同的位置看到的却是婴幼儿产品。

亚马逊如今大获成功,推荐系统想必功不可没。2012年第二财季,亚马逊营收达到了128.3亿美元,与去年同期的99亿美元相比大涨了29%。毫无疑问,如此惊人的增长肯定离不开推荐系统。亚马逊将其深度整合到购物流程的方方面面,从商品发掘到结账付款,几乎无处不在。登录Amazon.com,你会看到许多商品推荐板块;点入某个商品的网页,“人气组合”与“(浏览了该商品的)用户还购买了其它商品”等栏目赫然在目。不过,亚马逊对推荐系统的效率守口如瓶。【亚马逊的一位发言人向《财富》杂志(Fortune)表示,“我们的任务是取悦用户,让他们在不经意之间发现美妙的产品。我们相信快乐每天都会出现,这是我们衡量成功的标准。”】 继续阅读

微软推出outlook邮箱

微软今天推出了outlook.com的邮箱,可以直接使用原来hotmail的账号登陆,关键的是界面真的小清新啊,非常喜欢,看截图:

看起来跟本地的邮箱客户端一样,赞!

大量的使用了ajax技术,整个操作非常流畅,而且还有动态的感觉呢。

看官方的介绍:

Outlook.com 通过集成来自您的朋友已在使用的社交网络的信息,帮助您更方便地工作、生活。除了内置 Office 和 SkyDrive 之外,我们还能帮您清理灰色邮件,便于您更快捷地访问有用的电子邮件。

内置Office和SkyDrive,走云计算的路线啊,这不是跟Gmail来宣战了吗?期待二者的碰撞!

百度关于site语法查询的问题公告

这段时间,百度查询网站的site值老是出错,终于百度出公告了:

大家好!

近期我们的系统在更新过程中出了些状况,导致site语法查询即site:xxx.com返回的数值非常不准,大部分站点site语法查询的数值与精准的索引量相比下降了数十倍以上,请大家不要因为site返回数值大量下滑引起恐慌和猜测,site语法数值的下滑不代表在百度中的真实体现降低。   请站长们登录百度站长平台,用站点索引量工具查询网站的精准收录索引,并且参考来自百度的流量变化来进行网站分析。 同时我们正在努力高优先级恢复正常的site查询服务,今后我们会加强相应的保障机制,避免再次出现同类问题,非常抱歉!

看来这次百度更新真的扯到蛋了……

No Category Base 插件失效的解决办法?

查百度收录,突然发现多了很多/category之类的分类,明明WordPress安装着No Category Base插件的啊。后台查看了下,No Category Base插件处于启用状态,并没有被关闭。也就是说虽然运行着但是已经失效了。

百度了一下,找到了LMT博客的一篇文章,修改之后解决了,内容转载如下:

No category Base失效的解决办法

经查,是Wordpress升级之后的Rewrite规则变了,而no category base还没有升级,导致功能失效的。

解决办法:
只需要在后台找到WP No Category Base,然后点击编辑进入插件编辑页面,在 wp-no-category-base/no-category-base.php文件中找到下面代码:
$wp_rewrite->extra_permastructs[‘category’][0] = ‘%category%’;
修改成:
$wp_rewrite->extra_permastructs[‘category’][‘struct’] = ‘%category%’;

保存之后,刷新看一下目录链接里的category是不是消失了。

纯文本链接可以吸引百度抓取的证据

很久之前我写过 文本格式的网址对网站的权重有好处 ,今天我终于发现了纯文本链接可以吸引百度蜘蛛的证据。

大家知道百度站长平台已经对站长开放了,其中有很多有用的功能,包括提交网站地图,查看robots规则等等。其中有一项功能大家可能没有太注意,那就是站点抓取异常查询。

有时候我们的网站收录或者其他方面出现异常了,这时候还得分析网站日志等,查找原因。而这个工具可以直接查到,百度在抓取你的网站的时候出现了哪些错误,方便找到原因。

我今天检查的时候发现了有一个404抓取错误,本来抓取的是http://liboseo.com/1227.html   但是后面多了个“>”,理论上不会出现这种链接错误啊。

经过搜索发现,有网站在转载文章的时候,出现了如上图的网址,而且是纯文本的网址:

百度因为抓取到了上面的网址,并把>也当做网址的一部分,并进行抓取,自然就出现了404错误。

从这个例子就可以知道,百度是可以抓取纯文本的网址的,这对广大SEO工作者和互联网从业人员是个好消息。

友链上被K的博客转移到了内页

我的博客快照停止了,而友链上大部分博客似乎快照都差很多,还有两个朋友的博客连根拔起,虽然不知道是否会被牵连,但是为了保险起见,将这两个博客转移到了内页

同时也有可能是因为百度调整的原因,不必过于担心,只不过被k的网站确实比较悲催啊。好多人说淡定吧,那是因为站没有被k所以才能淡定吧。

所以以后做任何站都要认真……