我爱学习网首页 | 设为首页 | 收藏本站 | 网站地图 您好,欢迎光临我爱学习网
我爱学习网

当前位置:首页 > 编程开发 > php > php字符串处理 >

php 读取txt大文件中的随机若干行 连续几行

时间:2016-03-25 14:53 来源:未知 | 作者:我爱学习网 | 本文已影响
PHP操作大文件,比如需要分析系统日志等问题,有的日志文件可能很大,几个G以上,如果用file和file_get_contents函数的话,就会产生问题,由于这两个函数是一次性将文件内容加载到内存中,而有时候PHP本身或机器内存的限制,往往就会产生内存的溢出。
我们可以用fopen,fgets函数通过指针进行操作,看如下代码:

function getFileLines($filename, $startLine = 1, $limitLine = 50, $method = ‘rb’) {
$content = false;
$fp = fopen($filename, $method);
if($fp) {
// 跳过前$startLine行
for ($i=1;$i<$startLine;++$i) {
fgets($fp);
}

// 读取文件指定行内容
$limitLine += $i;
for($i;$i<=$limitLine;++$i){
$content[]=fgets($fp);
}
}
fclose($fp);

return $content;
}

除了这种方法之外,还有效率更好一点的方法,那就是使用SplFileObject。
 
从 PHP 5.1.0 开始,SPL 库增加了 SplFileObject 与 SplFileInfo 两个标准的文件操作类。SplFileInfo 是从 PHP 5.1.2 开始实现的。
 
SplFileInfo 仅用于获取文件的一些属性信息,如文件大小、文件访问时间、文件修改时间、后缀名等值。
 
SplFileObject文件操作类继承了SplFileInfo的所有功能,它将PHP文件中的I/O函数综合在一起如fopen()、fread()等函数,形成了一个多功能的面向对象的接口。可以使用这个类以面向对象的方法来读取和操作文件数据,同时还能获取文件的大小及其它详细信息。
 
SplFileObject也是一个迭代器,并且还是可查找的,这允许通过foreach循环来使用文件的内容。如:

$it = new SplFileObject('php.csv');

foreach($it as $line) {
echo $line;
}

那么我们就来看看用SplFileObject如何进行大文件的读取操作,代码如下:

function getFileLines($filename, $startLine = 1, $limitLine = 50, $method = ‘rb’) {
$content = false;
$fp = new SplFileObject($filename, $method);
$fp->seek($startLine – 1);// 转到第N行, seek方法参数从0开始计数

for($i = 0; $i < $limitLine; $i++) {
$content[] = $fp->current();// current()获取当前行内容
$fp->next();// 下一行
}

return $content;
}

经过测试SplFileObject比上面的fgets效率要好一些,特别是文件行数比较多,读取的起始行数不在文件的前部时,效果更加明显。
读取文件连续若干行方法:
/** 返回文件从X行到Y行的内容(支持php5、php4)  
 * @param string $filename 文件名
 * @param int $startLine 开始的行数
 * @param int $endLine 结束的行数
 * @return string
 */
function getFileLines2($filename, $startLine=1, $endLine=50, $method='rb') {
    $content = array();
    $count = $endLine - $startLine;  
    // 判断php版本(因为要用到SplFileObject,PHP>=5.1.0)
    if(version_compare(PHP_VERSION, '5.1.0', '>=')){
        $fp = new SplFileObject($filename, $method);
        $fp->seek($startLine-1);// 转到第N行, seek方法参数从0开始计数
        for($i = 0; $i <= $count; ++$i) {
            $content[]=$fp->current();// current()获取当前行内容
            $fp->next();// 下一行
        }
    }else{//PHP<5.1
        $fp = fopen($filename, $method);
        if(!$fp) return 'error:can not read file';
        for ($i=1;$i<$startLine;++$i) {// 跳过前$startLine行
            fgets($fp);
        }
        for($i;$i<=$endLine;++$i){
            $content[]=fgets($fp);// 读取文件行内容
        }
        fclose($fp);
    }
    return array_filter($content); // array_filter过滤:false,null,''
}

(责任编辑:我爱学习网)


分享到: 更多