针对中小企业提供bs软件定制服务,包括但不限于进销存、基础财务、业务管理、协同办公等,只有想不到,没有做不到,欢迎咨询洽谈!
My records, experience and ideas.
做seo时刻离不开日志分析,但是每次都去服务器上下载,再用一些iis日志分析软件去操作实在费劲!更何况很多iis日志分析程序并不是我想要的效果……于是就有了这一版php集成的iis日志程序。
数据量太大导出超级慢,用LOAD DATA快速导入mysql数据。
批量读取本地的txt文件,并将标题、内容写入mysql中,基本思路就是遍历文件夹文件,读取,写入……其中主要的问题是转码,要不就会出现读取不到数据或乱码的情况。
服务器cpu高占用是常见的一种服务器问题,基本思路是服务器环境配置>sql语句,一步步排除。
图片在网页中是必不可少的组成部分,大多数情况下我们都是需要缩略图的,而有的时候对于缩略图的尺寸还有不同的要求——多个模块需要不同尺寸比例的缩略图,这时你可能就需要根据参数自动生成缩略图。
注意,是删除标签之外的所有空格,之前在采集内容的时候把标签属性这玩意给忘了,整的我都白采了……
本程序处理那些在文章中存在图片引用,而图片已经不存在(被删除)的情况。
如题。网站程序本身的不完善,导致网站运行时间越久垃圾文件就越多,人为去处理那些垃圾文件是不现实的,还好php能帮我们搞定。
php利用split或mb_split将一篇文章按指定字符(标点符号)分割成多个句子的方法。
采集数据,得到的内容往往很糟糕,需要处理后在输出,既满足用户体验又提高代码的相应速度,还能减小数据库的占用,一举多得!而处理这些乱七八糟的数据,正则替换就必不可少。本文讲述的是php正则清除src属性外的所有html标签属性!
采集了好多数据,直接用免费的火车头来弄的,因为免费版无法直接导出导入,所以用sqlite来进行中间处理,结果发现有时某项内容不论导出什么格式都会出现乱码,而在sqlite中查阅时却没有任何问题……
在写程序的时候很难避免重复执行相同或相似的代码,用thinkphp同样会有重复代码,对于这些多次重复使用的程序,thinkphp有内置的办法,也有我们手动创建的方法来精简。
做一个b2b,想要一些特别的排序方法,于是找了些资料,结合自己的情况修改而来。
上午批量处理关键词(有数据库读写操作)时意外断电,来电后继续执行程序却出现错误:Table xxx is marked as crashed and should be repaired。
无需写任何采集规则,自动采集整站图片,可以是图片地址,也可以直接下载保存。
采集本身不难,但因html的不规范,每个人写的代码都不相同,所以需要写各种各样不同的规则,这就让采集显得很是繁琐。本文提供一种一键采集的思路,其实还有几种不同的做法,下次有时间再来分享。
采集百度图片,用了火车头,不知道怎么制定ajax页面,最终只好自己写了一个,原理很简单,重点就是找到ajax页面,而这个很简单,打开百度图片,搜索关键词,进控制台,切换到网络模块,查找即可。
采集的文章会有很多不可控的内容,如果量太大,手动替换就显得很不现实,本代码采用php的preg_replace函数,用正则批量自动替换文章中的电话、网址等内容。
今个在群里有朋友问到:在html后缀后面,随便加数字,网页还可以正常打开,比如http://www.gake.com.cn/mysql/blog-1043.html,在后面加数字或其他内容,如blog-1043.html123,blog-104.htmlxxx,这种是错误,为啥不提示错误呢?
还是之前的问题,我需要计算tf-idf,目前有词汇28万余条,语料87万余条,web端查询效率太低,于是想着在mysql存储过程中进行。
这两天一直在鼓捣tf-idf的问题,在计算其值的时候发现效率太低(我用的like模糊查询),于是想换成match against进行全文检索,结果测试才发现这里有坑(之前都没怎么用过match against)。
一直在伪,前几天发现手底下的所有站索引都在降,更有部分纯采集的站,掉的十分厉害,于是还是想着要创作一下,就有了这一篇利用tf-idf进行伪原创的实操。
update 表 set `字段`=replace(`字段`,'需要替换的内容','替换成的内容')。
定时自动发布,顾名思义就是让程序去执行,每隔x时间就发布n条网站内容,这一点对于网站优化来说是非常有必要的,它能让蜘蛛形成习惯,给搜索引擎营造一个良好的形象。
现在做网站早就离不开手机端了,几乎90%以上的网站都有手机端,甚至部分网站 只提供手机端页面。对于那些既包含电脑端又包含手机端的网站,应该怎么去判断并给予用户适合他的访问页面呢?
类目组合——其实我不知道业内怎么叫的,这是我个人的叫法……不过很好理解,就是多个类目两两组合形成大量数据。
做seo必定会涉及内链建设,而对于网站框架来说,其内链结构在程序写好之后就已经确定了,我们要做的只能是文章内容的内链。对于文章内链来说,最好的方式还是手动创建,这样可以保证真正的相关并且确实存在推荐意义,但事实上,因为工作量或计划等问题,人工创建内链其效率过于低下,所以就有了自动内链这一方法。
update gk_article set cont=left(cont,locate('相关推荐',cont)+2) where cont like '%相关推荐%';
ThinkPHP一个项目连接多个数据库,M('Cont','','mysql://caiji:123456@localhost/caiji#utf8');$data=$db->select();
file_get_contents无法抓取https协议的内容,在php.ini中开启php_openssl.dll即可。