|
|
用户名:hostxp 笔名:陈石 地区: 广东-广州 行业:其他 |
| 日 | 一 | 二 | 三 | 四 | 五 | 六 |
网络好东西 SEO
私营企业管理者注意
(作者置顶)
国内虚拟排行
(作者置顶)
2005年虚拟主机的市场该怎么走?
(作者置顶)
虚拟主机行业还需要什么?!
(作者置顶)
ZT:把男友升级为老公的时候发生的BUG
ZT:把男友升级为老公的时候发生的BUG
技术负责人请看:
您好!
去年本人把"男友5.0"升级为"老公1.0",发现财务软件发生意外的变化,导致与在"男友5.0"版本下
,运行良好的"flower"和"装饰品"应用程序的连接发生障碍。而且"老公1.0"系统删除了"浪漫9.9"等软件
,并擅自把"足球11.0"或者"NBA3.0"安装进去。更糟糕的是,"沟通8.0"也不象以前那样灵活,"家务2.6"
子系统渐渐处于崩溃状态。我试图用"唠叨5.3"解决问题,还是没有效果。
请告诉我如何解决此问题?
几乎绝望的用户
用户请看:
请注意,"男友5.0"是娱乐版软件,但是"老公1.0"是操作系统。请在Ms-Dos方式下,输入"c:/你现在
不爱我了?"命令,之后请安装"眼泪6.2"。这样,"老公1.0"可能会自动运行"内疚感3.0"和"flower7.0"
应用程序。但是如果使用过多,"老公1.0"可能会把"沉默2.5"或者"啤酒6.1"设置为缺省程序。
其中"啤酒6.1"有时还自动创建"打呼噜"音响文件。
请千万不要安装"婆婆1.0"或者别的"男友"软件,这些都不会给你带来帮助,甚至有可能破坏"老公
1.0"。
总之,"老公1.0"是一个不错的系统,只是它的内存有限,所以要适应新的软件,需要一定的时间,
若要提高其性能,请添加新软件,比"好吃的饭菜3.0"。
MiMi-Blog
| MiMi-Blog | |
| MiMi | |
| 24 | |
| 1982.4.1 | |
| 女 | |
| 妈妈没告诉我 | |
| 牧羊座 | |
| 上海.广州 | |
| 一天的好心情從Mimi-Blog開始! 經過幾天歐歐的辛苦耕耘,我的Mimi-Blog就從這裏開始暸```````Happy! happy!謝謝哦! 一直都喜歡塗塗寫寫的感覺,以前喜歡寫日記,由于某些原因中斷暸.也因為工作沒有閑暇去思攷某些問題```有點遺憾!Mimi-Blog將再次讓我放飛自己,同大傢一起分享我的喜悅,悲傷,但願少一點悲傷,多一些快樂! 來這裏的每個人應該都是認識我的暸,所以不用我介紹啦```希望跟大傢分享許多好東西,如果有什么好的意見告訴我哦```` 歡迎來到Mimi-Blog ! | |
| 泡GG |
刚刚接触http://video.google.com/
如果您的网站在引擎一直未被收录,请点击下面的对应名称手动登陆引擎!!
集中/分布式搜索引擎的4种设计方案
对于搜索引擎, 在索引量和搜索量大到一定程度的时候, 索引更新的效率会逐渐降低, 服务器的压力逐渐升高, 因此基本上整个搜索引擎的利用率可以说是越来越低了, 并且随着海量数据存储带来的困难, 设计一个良好的分布式搜索引擎将是一个搜索引擎能否面相未来发展的关键因素了.
那么分布式搜索引擎的最主要的核心问题是哪些呢?
1. 分布的信息获取和计算以及对此进行的数据统一
这里面包括爬虫/或者相应的数据获取机制的分布, 对信息进行加工的统一管理
2. 数据处理后的分布存储和管理
主要是文件的准确定位和更新,增加,删除,移动的机制
3. 前端搜索服务的分布
主要处理大规模并发请求时的分发机制
基于以上3个基本需求, 基本上可以构造如下4类的分布式搜索引擎:
1. 分布式元搜索引擎
2. 散列分布搜索引擎
3. P2P 分布搜索引擎
4. 局部遍历型搜索引擎
下面逐步介绍以上4类可扩展的搜索引擎:
1. 分布式元搜索:
拥有多个单个的搜索引擎, 中心搜索引擎是利用这些分布的单个的搜索引擎的结果进行撮合得到完整的结果.
这样的设计方案要求各个单元的搜索引擎拥有相同的排序算法和基本相同的数据输出结构,以便由中心搜索进行整理。
对于这类的搜索引擎,关键的设计是要求每一个单元所拥有的索引不构成重复,但是进行数据的采集(爬虫)时可以采取独立的系统获取后再按照规则分布到各个单元上。
优点,设计简单,快速,并且任何一个单元可以随时的摘掉但并不影响太大。
缺点,对于大规模的并发并非好的解决办法
2.散列分布搜索引擎
根据Query对索引服务器和文档服务器进行散列,做到对于任何的索引词能够准确的定位到具体的索引服务器并从而定位到正确的文档服务器。
优点,抗压,设计简单
缺点,对于单个索引服务器或者文档服务器的容量等动态的调整较困难
3.Peer 2 peer 搜索引擎
著名的Napster就是这样的一种设计,利用集中方式的索引,配合分布于世界各地的单个的计算机形成的文件源,构成了世界上最庞大的p2p搜索引擎之一。
这种设计里的中心索引服务器只记录一些相对关键的信息,例如位置(IP,序列号),歌曲的名字,作者等,其它的信息一概可以从任何在线并且拥有本条全面信息的计算机上获取。同时p2p也可以根据搜索建立一些中间路由的缓存,即将一些搜索结果存在单个或者相近的节点上,加快搜索速度。
优点,可以超级大,基本上不需要有维护成本
缺点,中心服务器的更新效率很低,信息源不稳定
4. 局部遍历型搜索引擎
这类的搜索引擎又可以采用多种设计方案,其中比较可行的是对信息进行聚类后建立信息树,搜索时只需要从树的一个分支下去遍历便可以了。局部遍历应当有一定的规则,并且在设计初期就需要对每一个加入的索引进行相对准确的位置安排,使得放置在合适的节点上,以保证搜索的效率。
优点,容易解决抗压,搜索精度高,搜索效率高
缺点,设计复杂,调整索引所在节点的位置不易
总体来说,搜索引擎的设计方法可以很多,这里只是抛砖引玉,相信未来会有更多的巧妙的设计方案出现。
搜索引擎优化SPAM的清理规则::[
越来越多的人利用blog来进行搜索引擎的优化和利用此进行重定向. 这样的搜索引擎优化的SPAM严重影响了搜索引擎的正常排名也严重影响了BSP(博客服务托管)的良性运行. 两个月前曾经对博客动力和博客中国的spam进行了一次比较全面的整理, 但是2个月后的今天, 又有抬头趋势, 不得不再次动手清理, 而这次清理, 将公布这些垃圾源, 就是目标网站, 这些SEO的SPAM的目标网站我将定期公布, 以便各个搜索引擎定期清理.
下面具体介绍清理方法, 如果您对 trustlink比较熟悉, 就可以简单带过.
1. 由点到面.
先从系统内寻找任何一个垃圾词汇, 例如[免费激情小电影], 然后利用搜索引擎进行搜索:
search $key site:blogchina.com
得到一系列的SEO网站
2. 从面上进行抓取, 分词:
将这一系列的SEO网站全部抓取后进行分词, 分句, 得到一个扩展的垃圾词汇列表
3. 再次重复 1. 的过程.
将全部的SEO网站的网页得到后进行 URL 的抽取, 得到一系列的垃圾网站的URL的源地址
4. 清理:
凡是有两个以上的垃圾词汇, 将被清理
凡是含有目标网站URL的, 清理
下面公布一些片段, 更多的垃圾网站的列表我已经整理好, 从这里下载.
全部的垃圾词汇, 从这里下载:
垃圾联接网站:
92 http://www.kan126.com/
87 http://www.555b.com/143.htm
84 http://www.555b.com/666.htm
84 http://freemovie.2288.org/00001\index.htm
垃圾词汇: 48 成人小电影
39 pp成人小电影
28 免费成人电影
27 激情成人小电影
27 免费电影频道
27 免费激情小电影
26 在线小电影
26 免费性电影
IIS 错误代码大汇总
HTTP常见错误信息说明