Archive for the ‘网站建设’ Category

  目前站长圈内,比较流行的采集工具有很多,但是总结起来,比较出名的免费的就这么几个:火车头,海纳,ET,三人行。下面我们对这几款采集工具作一个简单的评比。

  1.火车头 使用人数上应该是最多的,主要集中在新站
  特色:功能多,速度快
  优点:功能比较齐全,采集速度比较快,主要针对cms,短时间可以采集很多,过滤,替换都不错,比较详细,很多人写接口,发布,接口比较齐全,适合不太懂程序的站长
  技术:技术主要是论坛支持,帮助文件多,上手容易。有收费,免费版本
  缺点:功能增多,越来越大,费内存,速度快,采集的质量有些降低,不稳定

  2.三人行 主要针对论坛,可以称的上是第一
  特色:针对各大论坛,搬家,移动,速度快,准确度高
  优点:还是针对论坛,适合开论坛的
  技术:收费技术,免费有广告
  缺点:对cms支持比较差

  3.ET工具
  特色:无人值守,稳定,几乎不占内存
  优点:无人值守,自动更新,适合长期做站,用户群主要集中在长期做站潜水站长。软件清晰,必备功能也很齐全,关键是软件免费,听说已经增加采集中英文翻译功能。
  技术:论坛支持,软件本身免费,但是也提供收费服务。帮助文件较少,上手不容易
  缺点:似乎帮助文件少才是这个软件的缺点

  4.海纳
  特色:海量,关键词抓取,可以预览采集内容,不用写规则
  优点:海量,可以抓取网站很多一个关键词文章,似乎适合做网站的专题
  技术:无论坛 收费,免费有功能限制
  缺点:分类不方便,也就说采集文章归类不方便,要手动(自动容易混淆),特定接口

  总结:追求功能齐全的,似乎应该选择火车头,火车头被称之为“无所不能”,初期作站,可以迅速采集很多的资源,充实网站内容。如果做论坛,那选择三人行,没错了,可以实现采集论坛,回复,搬家等多项论坛功能。长期做站,当然选择ET了,花点时间,弄懂,是个长期受益的事情。写好规则,设置好过滤替换,然后可以像开QQ一样,长期运行,不费内存,自动采集更新,分类明确,采集内容完整,可是说,一个站,一个站长+ET足够了。至于海纳,似乎不写规则,上手容易,但是对文章的发布上,不能如ET一劳永逸,反而觉得增加很多工作,但是可以做专题,这是网站专题一个不错的选择。

一直认为阿里妈妈没有有效的防作弊机制,自己持续点了二个月,每天都有一块多的收入,偶尔会点出个两三块。但是今天,阿里妈妈还是叫我品尝到了恶果。

不过话又说回来,阿里妈妈是使用“详细的人工核查”方式来查处作弊行为的,这点也可以看出阿里妈妈系统的滞后性,技术还是跟不上GG啊。

个人感觉,阿里妈妈的广告单价是如此的低,以至于低到8分钱/次点击,跟GG简直没得比。看来以后还是得以GG为重点了。可怜我的阿里妈妈已经有近30元的收入了。就这么说没就没了。

今天在此发文,希望各位认为“阿里妈妈没有有效的防作弊机制”的朋友们,当你们作弊的时候,千万要小心,毕竟阿里妈妈还是“有一定的反作弊机制”的。

上大学确实是一件很快乐的事,大多数人都是无忧无虑的,每天想着怎么向家里多要点钱。然后出去逛逛玩玩。

一个人一个月花再多的钱别人都没得说,因为每个人肯定都是根据自己的家庭情况在花钱的。

就像在我看来很多人花几百块钱买一双鞋是浪费,同样也有人看着我喝汽水是浪费。每个人从小接触的环境不一样,说句比较和谐的话“他的世界观、价值观就不一样”。但是我想说的是那些从来没缺过钱的同学不要以自己的角度去看待别人。

记得大一暑假的时候《大学生英语周刊》招募暑期推广员,当时由于去的人多还让大家搞了个类似演讲的活动,大概就是让你说说为什么要参与这个活动、打算怎么推广等等。当时绝大多数人都说自己是为了增加社会实践经验,只有说的是为了挣钱。我相信一定有很多人都是抱着挣钱的目的去的,但是不好意思说出口。

上大学我申请了助学贷款,但是我不想一直申请下去。我想凭借自己的双手去挣钱,大学了应该有能力养活自己的。村子一块念书没上大学的基本都娶老婆生孩子,都已经是一个家庭的顶梁柱了,我不想在每天让我的父母为我操劳,即使不能帮助家里我也希望自己能养活自己,虽然现在我还没做到但是我一直在努力。

大二一年我感觉到了很多郁闷的事,上大二了我不玩游戏了。但是我逃课的频率却明显增大了,最荒唐的是大二第一学期,很多课一学期加起来上的次数不超过10次,c++、数据结构这些专业课尤其逃的厉害的。到第二学期我收敛了一点,但是没有坚持住,期中考试后又开始很少上课。

我现在还记得大二第一学期的一天海啸给我说“咱这次放的假比十一长假还长”,确实,当时就是那样,经常一个多礼拜不去上课。出来混的总是要还的,混黑道是还命,混学校是还分数,很意料之中的我期末考试挂了两科。

第二学期虽然没挂科,但是最后考试那几天我感觉自己有点崩溃了,绝对不能再挂科,再挂科我真的要卷铺盖回家了。那几天我的压力很大,当年高考的压力都比不上那次,并经高考打的是有准备的仗,而期末考试我却没有任何的准备,完全是临阵磨枪。

很幸运这次临阵磨枪我成功了,没有挂科。

虽然没有挂科但是我突然感觉很失落,这种失落从期中考试后就有。大一的时候学习虽然不怎么样,但是一直认为自己的编程在班上还是能排上号的,到了大二买了电脑,刚开始确实想着有了电脑后就更要好好练习编程,一开始确实是这样做的,而且大二刚开始那一段时间我很勤奋,如果没有做网站的话我想我的勤奋会坚持下去,但是很不幸我做了网站。而且沉迷了进去,现在突然感觉其实做网站沉迷比玩网游沉迷还可怕,玩网游沉迷了当你感觉玩网游是在浪费生命的时候你就会毅然不玩了,但是做网站不一样,你越做会越感觉只要你再坚持一点一定会赚钱,就这样你会不断的给自己说再坚持一下直到你走到悬崖边上。很多大学生站长就是这样走到了大四最终很顺利的没有拿到毕业证书。

但是没有挂科还是很郁闷,直到现在我都很郁闷。郁闷的原因很简单因为我学人落伍开始做网站了,开始冒充个人站长了。

上大二了,我真的没怎么玩过游戏,一年当中玩游戏的时间绝对超不过40个小时,但是上网时间却太长了,长的无法计算!

不错,这些时间我都用来做网站了。其实说做网站有点大言不惭了。做论坛的时候下个DZ,做CMS的时候去织梦转一圈,一块钱买个CN,100多块钱买个空间一会一个网站就成功了。大二做了一年前前后后做过的网站有几个从来没数过,但是花的钱我数过,比起赚的钱来说只能用一个

成语“出入相抵”,用个英语短语就是make both meet ends!

比起挂科来说,这个对我的压力更大,我什么都不干,不玩游戏不上课。甚至被N多人鄙视,认为我不务正业,莫名其妙。但是我一直在坚持,

因为我想借着这个挣一点钱,我想凭借这个大学期间自己养活自己。但是很不幸,虽然像很多大学生站长一样挂科了,但是我没有像他们那样赚钱。

现在分析失败原因的其实很简单——想法太幼稚了。第一个网站也是唯一一个坚持到现在的网站我做的是历史论坛,因为当时认为铁血是依靠军事起家的,天涯是依靠文学起家的。那么我就依靠历史起家,几年后也像天涯、铁血那样成为大网站!

试试再一次证明中国人都是很聪明的,你能想到的肯定有人现在在做,而且很可能人家都做了N久了,只是一直没成功没人知道而已!或者说已经很成功了只是你不知道而已!

事实就是这样残酷,当我做历史论坛的时候我发现历史类的论坛已经有一大堆了,更叫我郁闷的是,原来天涯的煮酒是中国最牛叉的历史类论坛,而且很多牛逼的书都是最先在他们那发的,最出名的就属于《明朝那些事》了。以前就听人说三代出豪门,不错。网站的人气也是这样尤其是会员的整体素质更是这样。小论坛根本吸引不到什么人。就算暂时吸引到了,但是那些水平很高的牛人在发现水平更高的地方后就会默然离去!

就这样我那个历史论坛到现在还不死不活的做着,刚才我撤去了论坛所有的广告,以后我不打算用这个论坛争什么钱了,但是我会一直保留着他,权当纪念。几十年之后看到这个论坛我会回忆起我的大学生活,我会想起当年为了我的梦想曾经努力过虽然那个梦想那么的幼稚!

论坛虽然做了一年基本上是以失败告终,但是我真的不甘心。所以暑假我回到家里说服了父母给家里装上了宽带,我绝对就以一暑假的时间全身心,要是赚钱了或者有赚钱的苗头以后我还会继续做网站。

很幸运,这次我看到了希望。从一放假便开始考虑做个什么站,一会想着做小说站一会又想着做图片站刚坐起图片站又感觉做QQ站比较好。就这样几天搭建起来每天又卸载了。直到7.29号还确定了下来。

这次真的很幸运,做的是电影站,以前从来没试过。用的是马克思,网站刚一搭建起来在贴吧发了几个帖子不停的顶,当天网站的ip就达到了200多,第二天换了一种方式不去贴吧宣传去XX(只所以用XX是因为我一会打算用这篇文章去落伍把我的马甲给落伍了!被那帮MJJ听到了都那么干,那我以后就压力很大了!)发广告贴,很快到第四天的时候日ip就达到1000+了,从前天(8.17)开始ip达到了2000+。算了一下,每天从gg多的话1刀一般情况下都是0.5刀以下,确实做电影站gg单价确实低。从迅雷2000ip一天能有1块多的收入,因为站内很多比较引人注目的电影都是迅雷资源,比如最新出来的赤壁、色戒。如果你有兴趣的话可以去我的小站看一下(在迅雷看看你是搜索不到赤壁的)。

事实证明我刚开始做站的时候确实很幼稚,看不起垃圾站,但是经过一年的郁闷之后我终于也开始做垃圾站了。突然发现原来垃圾站确实好赚钱,按照我现在的这个势头我感觉最多2个月日ip就可以达到1W,虽然有个大佬总是1个月日IP就上万,但是他那个域名是老米,而我的这个域名是新米而且是毫无特色的CN米,一元一个!但是这一元一个的米用起来感觉不比最低50元的com米差多少,用起来还是那么舒服。

就算ip到不到1W就依靠现在这个水平放上弹窗一天20块没有什么问题,但是我不想那么干,虽然是垃圾站但是我也要做垃圾站当中的行业站!

最少我不会让进入我网站的人第一印象是我的网站是垃圾站!

我做网站那点破事写完了,很多话一直想说但是一直没说过,借着这些文字我说了出来,感觉很畅快。

是的,在大学我领着国家助学金,在很多人的眼里现在领助学金的基本都是在装穷。但是我想说,有钱谁愿意装穷,谁愿意被人背后或者在心里说厚脸皮,不管是谁只要递交了助学申请书多多少少都有自己的无奈。

说真的,那些在大学可以想着各种接口让家里增加生活费的人很幸福,这没有什么错,你的家庭环境允许你那么干,你要多要少你们家里不会感觉到什么。

但是很多人并没有这么幸福,他们会想着办法给家里节省钱,当然这并不是嘴上说说自己不想花家里钱实际上确花起来丝毫不心疼的人。

以前看过一篇文章也是一个来自农村的而且申请过国家助学金的同学写的文章,就是在校内网看见的。在那篇文章里面作者说道自己看不起那些整天缩衣节食装可怜的贫困生,虽然他也是贫困生但是他凭借自己的本事自己养活自己。其实那篇文章有些过激了,每个人都有自己的生存方式以及自己的做人准则。

不过我更希望我能在大学期间自己养活自己。

写不下去了,本来写的激情澎湃但是中途吃晚饭,后面的200多字基本是胡写的,没有感觉了。按照现在的势头,过2、3个月我便可以凭借做网站给自己挣一点生活费了。

百度对网站的五种惩罚与解决方法

搜索引擎的惩罚多种多样,百度做为中文搜索的龙头老大,是我等草根站长不敢怠慢的,很多人是否还不够了解他的脾气,下面小生以自己经营湖南涉外经济学院论坛的亲身经验讲一下百度的惩罚和补救措施,希望对大家有所帮助。

1,首页沉底
在百度中site一下自己的域名(例如site:www.zhukun.net)如果首页不是在第一位,可称为首页沉底。
现在要声明的是首页在百度沉底不一定是惩罚,你site新浪会发现它也沉底了,但是对于多数个人站长来说,首页沉底往往是一个信号,说明百度可能要发飙了。
一般来说在百度中首页刚沉底时排名不会有变化,流量也不会下降,所以说它是一个信号,下次更新时你可能要受惩罚,这时你应该看看在百度中直接搜索你的url例如http://www.zhukun.net)看看是否还在,如果首页没被k,应该不是惩罚或较轻的惩罚,如果首页被百度k掉了,那你很可能有大麻烦了。
解决方法:建议大家未雨绸缪,首页沉底了赶快检查连接,去除不必要的优化,比如堆积关键词,隐藏文字,垃圾链接,桥页,弹窗,站点结构复杂,服务器不稳定,群发垃圾链接等等,顺便应该搞搞原创,初学seo的人很容易优化过度,现在百度对这个很敏感,奉劝各位三思而后行,凡事过犹不及。

2,拔毛不降权
拔毛就是百度收录页数大幅减少,当然这是针对你原先的百度收录页数而言的,剩余量应该为原先的百分之十到百分之五十不等,百度拔毛一般发生在大更新的时候,这也是刚才说的首页沉底所带来的可能后果之一。
拔毛不降权是指百度收录减少但剩余页排名基本不变,这种情况还比较好,一般会继续收录你以后的页面,并保持一定的权重,如果能改掉涉嫌作弊的地方,还可能全部收回,这叫做百度洗牌,据观察近期百度正在加速拔毛和洗牌,我以为这是要消灭垃圾站的一个信号。
解决方法:这种情况一般是优化过度,轻微作弊或者大量复制别人文章造成的,踏踏实实尽量原创做站,去除优化过度的部分,应该可以搞定。

3,拔毛加降权
这算是比较狠的了,我相信不用再解释大家也知道是什么意思了。这种情况的发生是百度认为你有比较严重的作弊行为,这样以后即使收录再多的页面,也基本不会带来什么流量。
解决方法:这种情况如果是垃圾站其实已经可以不做了,因为基本上没什么机会再提权了,如果是正规站,确认自己没作弊,检查连接,坚持原创,总会有机会的。

4,光杆司令
这是说百度k的只剩你一个首页了,作弊的话,这个基本上是死了。没作弊的话,检查有没有触犯法律的内容(含zheng zhi敏感信息,色情赌博等),和多个同服务器网站互连,大量复制粘贴或采集,别说你没有,没有是不会这样的。
解决办法:这个自然解封很难了,正规站确认不再作弊后建议给百度发发邮件看看有没有一线生机。

5,k站
就是说你的网站在百度site已经完全不存在了,这没啥好说的,到了这一步你还不知道自己犯了什么错吗?对了,太多的域名指向一个站,也可能导致部分域名被k。
解决方法:同4

小生始终认为网站作弊如饮鸩止渴,到最后肯定会害了自己,玩火者必自焚嘛。踏踏实实做站,为用户努力做内容,保证百度会喜欢你的。最后引用百度的一段话: 惩罚不是目的,让互联网洁净才是目的。对任何取消作弊行为的网站,百度都持欢迎态度。并会在一定的惩罚期满后解除惩罚。惩罚期视危害程度而定,从1个月到3个月或者更长不等。被惩罚的站长,在取消作弊行为后,请发邮件到spam@baidu.com申请解除惩罚。在邮件中,请描述自己作弊的方式,受惩罚的大致开始日期,以及作弊行为修正日期。

本文来自落伍者论坛

dedecms采集系统确实很不错,可以免去一些站长手工添加信息的麻烦,设置一下采集规则、采集点,然后点采集,OK,几百篇文章就搞定了!呵呵,确实很省事的!下面介绍几种常用的采集规则的过滤方法:

应用示例一:标题中空格的过滤
经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤

{dede:trim} {/dede:trim}

应用示例二:来源作者中连接的过滤
在采集文章的时候,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤。

1,如果要保留链接中的文字:
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}

2,如果去掉链接中的文字:
{dede:trim}]*)>([^<]*){/dede:trim}

应用示例三:文章内容中连接以及其他广告代码的过滤
这个就不用说了,当需要对所有东西过滤的时候,直接用上面所有的代码过滤就可以,但是实际应用中,我们只需要对连接、动画、调用等进行过滤。(这个需要按照对方内容里面具体含有什么代码来具体操作)
一般的只有链接,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:

{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}

过滤div可以用
{dede:trim}]*)>{/dede:trim}
{dede:trim}
{/dede:trim}

过滤js用下面这个
{dede:trim}]*)>([^<]*){/dede:trim}

过滤未知变量字符
固定(.*)固定

应用示例四:过滤GG广告代码
其实这个就是在上面的内容过滤,但是很多论坛里的网友经常问这个,所以单独作为一个应用列出来:

{dede:trim}]*)>([^>]*){/dede:trim}

下面是在综合论坛上网友的各种正则的一个全集:
{dede:trim}
{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} ]*)>([^>]*)

{/dede:trim}
{dede:trim} ]*)>{/dede:trim}
{dede:trim}

{/dede:trim}
{dede:trim}
]*)>([^>]*)

{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}

{/dede:trim}
{dede:trim}
]*)>([^>]*)

{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}

{/dede:trim}
{dede:trim}
]*)>([^>]*)

{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}

{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}
{/dede:trim}

好了,上面四种应用基本上涵盖了采集的各种应用,掌握了这个,过滤基本上就不用求人了!下面教大家一个更简单的方法,把下面的过滤规则复制到你那里去,几乎就可以处理所有的问题了,当然也可以自己分析一下。
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}

{/dede:trim}
{dede:trim}

  • {/dede:trim}
    {dede:trim}
  • {/dede:trim}
    {dede:trim}

      {/dede:trim}
      {dede:trim}

    {/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}
    {/dede:trim}
    {dede:trim}

    {/dede:trim}
    {dede:trim}
    {/dede:trim}
    {dede:trim}

    {/dede:trim}
    {dede:trim}
    {/dede:trim}
    {dede:trim}

    {/dede:trim}
    {dede:trim} {/dede:trim}
    {dede:trim}

    {/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}

    {/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}
    {dede:trim}{/dede:trim}

    上面这一段万能采集过滤代码,不能用来采集带有视频的页面,因为已经过滤了视频,最后的四行是过滤掉视频的。如果你确认要采集视频,那就去掉最后四行。