做搜索不是这样做的,怎么可以伪装蜘蛛成普通用户来大量抓取网页呢?
正规的蜘蛛应该告诉服务器,它是一只什么蜘蛛,来自何方,是来执行抓取页面的任务的。
这群蜘蛛却不这么做,网上搜索到说是腾讯QQ的。
不管怎样,屏蔽如下的IP
58.61.164.38
58.61.164.39
58.61.164.40
58.61.164.41
58.61.164.42
据说还有其它的IP,等我发现困扰,再屏蔽不迟。

九月的新闻稿发布了。
1)系统级的升级
Dreamhost将花一年的时间,把所有的服务器都升级,原来共享的文件服务器将被取消,每个服务器将有自己的文件储存空间,相当于本地硬盘。
升级完成后,将节省50%的耗电。而且故障率将下降。
2)做优先升级的志愿者
点击这里,成为优先升级到新服务器的志愿者,并且获得无限空间和流量。
3)通过IMAP,隔离Spam email
这部分就不多说了,因为我通常都是转发到Gmail,Gmail的email管理更为方便。
4)Webmail 升级到 1.4.15
虽然升级了,看不出有什么改进。
若要购买Dreamhost空间,那么可以使用G2SAVING优惠码,你可以获得$50美元的折扣(现在最多的折扣只有50),以及我另外附送的可以永久使用的域名一个(这是在Dreamhost本身1个免费域名之外,另外送的,所以就有两个域名了)。

这几天在做网站优化,也看了本站的log日志,其中有一些奇怪的请求以前没有注意过,是apple-touch-icon.png,返回的都是404错误。
这个文件是什么东西呢?
通过搜索,可以了解到这是一个类似网站favicon的图标文件,用来在iphone和ipod上创建快捷键时使用。
这个文件应当是png格式,57x57像素大小,放在网站根目录之下。
如果准备的文件不是57x57的话,它会自己缩放的。
在页面的head部分,用下面的格式表示。
<link rel="apple-touch-icon" href="/apple-touch-icon.png"/>
随着Apple公司的东西越来越多人使用,这部分的用户也不应当被遗忘。

Google AdSense for Games上线了,据Google AdSense官方消息,任何游戏站点,每天有不少于500,000次游戏使用,并且80%的流量来自于美国或者英国的就可以申请。
这些广告可以展示在游戏开始前,游戏结束后,或者通过某关时。广告类型包括文字,图像以及视频广告。

据新浪科技报道,由Google投资的全球清晰度最高的商用成像卫星“GeoEye-1”拍摄的首张照片——位于美国宾夕法尼亚州的库茨敦大学(Kutztown University)的鸟瞰图近日曝光。GeoEye-1于本周早些时候正式启动服务。
这张照片拍摄于美国东部时间10月7日中午,当时这颗重达4300磅的卫星正以每小时1.7万英里(2.72万公里)的速度,在距离地面423英里的轨道上由北极向南极运动。GeoEye公司通讯与市场副总裁马克·布兰德(Mark Brender)透露,该卫星在空中的拍摄精度可以精确到41厘米,足够放大一个棒球场内的本垒区。

虽然GeoEye-1卫星服务因Google而备受关注,但其主要客户并非Google,而是一家政府机构——国家地理空间情报局(以下简称“NGA”) ,该机构从事美国国家安全所需的影像分析。在GeoEye-1卫星5.02亿美元的研发经费中,NGA承担了一半用,并承诺购买其影像,而Google只不过是GeoEye的第二大投资人。
“这绝不是一颗间谍卫星。”布兰德在电话采访中表示:“因为间谍是不会将影像资料放到网上出售的。我们只是提供地球成像卫星服务,任何有地理测量、监控、绘图需求的客户都可以购买我们的图片。”
上世界70年代末以来,美国军方一直在使用高清间谍卫星,甚至能够看清苏联红场上一份报纸的头条。但直到最近几年,这些技术才逐渐转向民用,并大幅提升了覆盖范围及清晰度。例如,Google2004年推出的“Google Earth”服务,其图像还很模糊。但到了2006年3月,全球三分之一的人已经能够看到自己家的高清鸟瞰图了。
当然,Google的地球服务也受到了限制。布兰德透露,由于美国政府管制,其在向NGA提供最高43厘米清晰度图片的同时,只能向Google提供50厘米清晰度图片。但Google目前是GeoEye的独家合作伙伴,换而言之,其是唯一能够使用GeoEye-1图片的地图网站。
作为全球精度最高的商用成像卫星,GeoEye-1于9月6日在加州范登堡空军基地发射,目前还处于校验阶段。而第二颗成像卫星GeoEye-2预计在2011至2012年发射。GeoEye公司表示,第二颗卫星的清晰度将达到25厘米。而由于美国政府的管制,Google地图的清晰度不会随之提高。
继续阅读《Google商用卫星传回首张高清晰照片》的全文内容...

最近本Blog感觉有些响应慢,只是主观的感觉,没有进行测试。
估计是spam的无效访问太多,拖慢了速度。
幸好我用的是Dreamhost主机。它提供了非常多的工具可以来维护系统。
比如这个IP Abuse Detection Script,它可以用来检测网站的Error.log和Access.log,看访问最多的那些IP,如果没有反向解析的域名,就值得怀疑,就会放到.htaccess的禁止访问的列表中,这样,当这些IP再来访问时,就会获得403禁止的代码。

如果你把里面一些被标记为possible abused的IP地址,放到Google里搜索一下,就会看到很多讲spam的文章有提到这些IP。
下面把我添加到.htaccess中屏蔽掉的IP地址列出来。
## IP-ABUSE-LOOKUP Order Allow,Deny Allow from All Deny from 117.12.105.220 64.27.21.12 220.181.32.41 216.195.34.195 Deny from 60.21.99.81 116.21.74.60 209.85.238.10 Deny from 123.52.79.10 220.242.97.250 125.121.195.134 61.135.221.50 Deny from 116.76.68.226 118.113.13.128 220.181.61.231 58.30.18.49 Deny from 65.214.44.28 211.136.108.219 220.181.19.107
过几天再看看,网站速度会否有些改善,CPU资源占用有否下降,到时再报告。
更新:玩聚网的郑昀email,以去掉两个误以为是spam的IP地址。20081010

网络打手,是中国一种非常特殊的网络营销行为,通常是一些公关公司雇佣的枪手,他们在论坛、博客上使用各种片面、偏激而具有扰乱视听功能的文字来诋毁竞争对手。一些想要提高流量的网站也会有枪手去同类型的博客网站留言攻击,以期待将流量引入他们的网站。通常网络打手以谩骂、诽谤为主,语言通常比较夸张。
什么样的文章会招引网络打手
通常情况下,写某个行业的产品的评测(例子),评论某个知名厂商(例子)或者讨论某个公司的突发事件(例子)等等,都会引来行业内的网络打手。对于行业产品类型的网络打手,目的主要是诋毁竞争对手的产品,他们通常会对具体产品关键字进行搜索,在搜索结果中寻找可以留言的博客或论坛,然后在上面恶意攻击这个行业的竞争对手。一个典型的例子就是我先前写的“国内软件加密锁产品评测”的文章,这篇文章引来四五家同行业的网络打手,在文章后面留言攻击和辱骂竞争对手,颇为热闹,使得文章评论数多达四百多。
对于网站类型的网络打手,目的主要是吸引别人访问自己的网站,他们会访问自己同类型的博客,然后在各类文章后面进行恶意攻击,以期待吸引别人的眼球,将别人引导到自己的网站,这类网络打手常常混淆视听,发表一些毫无理由的攻击性言论,常见语类似“你的博客越来越差劲了,不如我的博客好看”(既然你的博客好看,奇怪的是你为什么要在我这里留言),“我要退订你的博客”(退订还要不断发留言声明,实在是一种怪癖),“原来这又是一片软文,你在我的心目中形象大打折扣。”(网络打手通常会以小人之心度君子之腹)
如何对付网络打手
通常来说,网站类型的网络打手容易对付一些,有精力的话可以和其针锋相对的辩论,没时间的话可以通过删除和屏蔽IP来对付(Z-Blog可以使用这个插件),知趣的人通常会知难而退。
诋毁竞争对手产品类型的网络打手不好对付,因为他们的工作带有很大的功利性,因此这类网络打手的干劲非常高,他们有大量时间和精力,封锁IP还会用代理服务器来继续诋毁竞争对手,例如我先前写的国内软件加密锁产品评测那篇文章一样,解决的方法最终只有锁贴,禁止所有人继续进行评论,网络打手无法发表评论,自然就离开了。
总的来说,网络打手是一种低端的网络营销方式,没有太大发展空间,且大部分网络打手对真正的网络营销并无太多研究,只知到用低级粗俗的语言诋毁竞争对手,最终结果可能往往适得其反,使得不少用户不再相信网络口碑。

本文译至<Living with Floaters> via eyeFloaters.com。
作为飞蚊症患者,我们现在并找不到太多相关的资料。如果去医院找大夫就诊,你得到的建议大多也只是“会慢慢习惯的”,或者“大脑会慢慢适应的”,云云。但这些建议完全不管用,尤其是对于那些刚刚失去清澈的视野,不得不开始每天都透过浑浊、肮脏的各种漂浮物看东西的人们。更可悲的是,那些所谓的专家并不理解我们的痛苦,他们完全不知道透过无数黑色小斑点观察到的这个世界是什么样子,他们只会简单的把它解释为“无害疾病”。从物理意义上来看,这些小飞蚊确实是无害的。但是,从心理学角度来看,它们完全有可能摧毁你的生活,摧毁你。基于上述理由,我决定写这篇文章(译者:我也决定翻译这篇文章),希望能给深受飞蚊之苦的朋友们一些建议和帮助。
勇敢面对你的恐慌。当发现自己有了飞蚊后,顺理成章,你会很自然的排斥强光,排斥纯色的背景。可是如果你长期害怕到户外去,害怕面对强烈光线,你恐怕会患上心理恐惧症。要知道,有了飞蚊,躲是躲不掉的,仅仅逃避强光也并非解决之道。你得学会正确面对自己的恐慌,强迫自己走到阳光照射的户外去。当最坏的情况你都能够面对和接受的时候,其他一切情况自然不在话下了。如果在一间墙壁纯白、光线充足的房间内,你的心里也十分放松,很好,你已经有了一个与飞蚊过日子的好开端。
看到事物的积极一面。不要老关注这些小飞蚊,关注一下你能看到的其他东西。比如想想缤纷的色彩,想想细节处的美丽,想想运动的物体,不要去想始终飘在最前面的那些飞蚊。这么说吧,目前95%的视觉是好的,相反只有5%不太好。比起5%而言,95%可要离100%近多了。尝试着心怀感激吧,比起0%的盲人而言,95%的你能看到整个世界。
试着想想比飞蚊症更糟糕的情况。比如说,你可以闭上眼睛,假装盲人生活几个小时,感受一下有多少事情是盲人做不到的。再比如说,如果你是近视眼,取下你的眼镜,看看眼前的画面有多么模糊。现在恢复到正常状态,虽然有飞蚊干扰,但比起盲人或近视眼,你该是心存感激吧。在失去之前,我们总是不知道珍惜已拥有的事物。所以请珍惜当下、享受生活吧,说不定,明天你就将失去它!
向飞蚊宣战。你莫非能眼睁睁看着这些小混蛋毁掉你的生活?放任这些小混蛋摧毁你的身体?让这些废物操纵你的生活、影响你的决定?你莫非愿意浪费整个夏天宅在家里,仅仅是因为这些小蚊子在强光下更加肆虐?答案当时是:NO!记住,你要比这些飞蚊强大一百万倍,重要一百万倍。你才是真正的老大!
不要总是盯着飞蚊看。我承认,尝试忽略飞蚊是十分困难的,但想一想,如果你总是盯着飞蚊看,它们就会一直存在于你的视线正中央,似乎一直飘舞就在你的正前方耀武扬威。相反,你应该努力转移自己的视线,置飞蚊于脑后。如果飞来飞去的小蚊子总诱惑你去注视它们,也请克制住自己。如果能让自己的注意力集中在外界事物上,而不是飞蚊身上,你定可以慢慢的忽略掉它们。
不要频繁的移动眼球。这并不是说让眼球完全保持静止状态,而是在移动眼球时,请尝试着轻缓一些,这有助于减轻飞蚊的干扰。因为每移动眼球一下,飞蚊们都会漫天纷飞一次,这倒是和那些里头装有雪花的玻璃装饰品很像。所以,眼球移动的次数越少,来自飞蚊的干扰也就越少。如果能让飞蚊彻底的停下来,你会有个惊奇的发现:它们似乎消失了!尝试一下这种感觉吧,请找一个地方安静的躺下,努力使飞蚊保持平衡,保持静止。一两秒钟之后,它们就会消失不见,可惜如果你轻轻移动视线,它们又复出了。。
(待续,还有下半集)
这次用的是YUIcompressor,这是Yahoo出品的JS文件压缩器。通过压缩可以获得非常小的JS文件。
以MovableType系统的mt.js文件为例。
原始大小为20.2k,因为已经使用了Gzip压缩,用YSlow的Componet查看,可以看到Gzip压缩后为5.9k。
使用YUIcompressor来压缩,处理之后的mt.js文件为11.6k,再经过Gzip压缩,就只有3.9k了。
这个压缩率是非常高的,按未经Gzip的文件来比较是压缩率57%。用Gzip之后的文件来比较是66%。
下面就来介绍一下这个压缩器。
这种压缩正确的说法是使文件最小化,就是通过去除文件中不必要的字符来缩小文本文件。
这些不必要的字符包括:空白字符,就是空格、换行、以及tab符号;注释。
这种压缩对于网站的好处就是减小了文件的大小,缩短了文件载入的时间。
做这项工作的有两种工具,其中之一就是Yahoo出品的YUI Compressor。
它可以用来缩小JS文件,还可以缩小CSS文件。
使用的方法是,首先下载软件包,并解压缩。取得jar文件。
然后把yuicompressor-2.3.5.jar(当前版本)和你准备压缩的js文件放到同一个目录之下。
进入Dos窗口,到该目录下。
输入如下的命令。
java -jar yuicompressor-2.3.5.jar mt.js -o mt-min.js
稍等一会儿,mt-min.js就做好了。
现在DavidYin看到SEO 网站优化推广的YSlow性能分为60。比最初有了极大的进步,同样我也看到有朋友反馈网站的loading速度有了很大的改善。

使用Firefox的网站开发者大多都会安装Firebug,而使用Firebug的用户也大多会使用YSlow。
今天DavidYin就用了YSlow来优化网站的性能,当然还是以本Blog为例。
测试的结果很不好,performance分只有F(27),根据YSlow的建议,对,htaccess中做了以下的优化.
FileETag none ExpiresActive On ExpiresDefault A86400 ExpiresByType application/javascript A2592000 ExpiresByType application/x-javascript A2592000 ExpiresByType text/css A2592000 ExpiresByType image/x-icon A2592000 ExpiresByType image/gif A604800 ExpiresByType image/png A604800 ExpiresByType image/jpeg A604800 ExpiresByType text/plain A604800 ExpiresByType application/x-shockwave-flash A604800 ExpiresByType video/x-flv A604800 ExpiresByType application/pdf A604800 ExpiresByType text/html A900 AddOutputFilterByType DEFLATE text/css application/javascript
这个部分是我可以做的优化,也是针对本站自身的优化,主要有两项,一个是增加文件的有效期,全局默认是1天,然后对个别文件类型进行个别设置。另外一个是增加Gzip的压缩设置,对于CSS和JS文件进行压缩,以提高响应能力。
还有一个是针对网站的"小玩意"部分,被全部移到"关于David Yin"的页面,将不再各个页面显示了。这个部分可以提高整个页面的loading性能。
对于原先的Feed订阅图标,简化为只显示订阅数。原因是Feedsky本身没有做优化,图片等都没有设置有效期。之前的小玩意部分也有部分原因是因为这个。
撤掉了雅虎统计的代码,没有什么特别的理由,只是完成试用了,觉得没有什么特色,所以撤了。
把三个CSS文件归拢为一个,全部放在了一起,减少http request数。
剩下的一些问题,则无法解决,因为不是本站自身的问题,也无从入手,除非不用,用了就只能这样。
比如 Reduce DNS lookups,因为需要有这些不同网站提供的服务,要用就一定会超过4个域名。
比如CDN的问题,如本Blog这样小的站点,没可能用到CDN,所以就让它F了。
比如 Minify JS的问题,大部分JS都来自鲜果和Google及统计系统。
现在我看首页的performance分值也只有F(52),不过网站的相应速度,以及整体的反应已经提高了很多,可以直接的感受到。
请来自各地的朋友,如果以前有来过SEO 网站优化推广的话,说说你的感觉。

搜索引擎周边
晨钟暮鼓
非官方的google黑板报
三秒改变世界
月光博客
SEO 网站优化推广
谷歌治印
肥硕博客 » 非说不可
享受Rss订阅统计和发行管理服务,