如何使用 Nodejs 删除本地文件前 1000 行内容?

发布于 1周前 作者 bupafengyu 来自 nodejs/Nestjs

如何使用 Nodejs 删除本地文件前 1000 行内容?

我是一个 nodejs 新手,由于某种原因必须利用 nodejs 简单快速地写一个处理文件内容的小小 app 。我看过 nodejs documentation ,有些懵逼,所以偷个懒来 V 站问一下大家。。

目的是想读取一个包含超多行数的文件,并对每一行内容做一些操作。如果全部读取的话内存不够,打算用一个循环去读取文件内容,每次读 1000 行,对这 1000 行数据进行一些处理之后,删除原文件前 1000 行内容,保证下一次循环不重复读取内容。

有没有人能告诉我删除本地文件的前 1000 行在 nodejs 中该如何实现

PS. 我试过 nodejs 的 readStream 模块去一行一行地读取。但是这个方法有一些小毛病,我不想考虑了。如果可以的话,能帮忙解决一下我问的上一个问题也可:请问如何使用 nodejs 的 readline 模块按行读取文件内容然后依次更新到 html 页面中?

PS 的 PS. 如果能用 shell script 做是超简单的,一个 sed -i '1,1000d' filename.txt 就搞定了,然而不得不用 nodejs。。


32 回复

可以用 node 开子进程执行 shell ?


我需要在 Windows 下用 node-webkit 写 web app , Windows 下可以用 shell 子进程不?

可以跨平台执行 shell 命令

我怎么感觉方向不对

node readline 模块 + socket.io
readline 模块实现按行读文件
socket.io 实现 客户端和服务器 交互

这种事用 shell

linux:
sed -i -n ‘1,1000d’ your_file

mac:
sed -i ‘’ -n ‘1,1000d’ your_file

没有接触过 socket.io ,不想现学了。

这个 shelljs 看起来很棒啊,我对 shell script 很熟,如果能在 nodejs 里执行 shell script 就太好啦。我马上去试试,超感谢。

你这个思路不对啊。不可能从一个文件的头部删除一千行,能实现的方法都是把 1000 行后的内容写到新文件,然后用新文件覆盖掉旧文件

那不对啊 前 1000 行读出来了 第二个一千行不行啊。

哇, sheeljs ,现在这个 js 啊,真的搞事情。

如果“目的是想读取一个包含超多行数的文件,并对每一行内容做一些操作”,那无论你文件多大, nodejs 都可以轻松处理啊! nodejs 可以流式读取文件, see https://nodejs.org/dist/latest-v7.x/docs/api/fs.html#fs_fs_createreadstream_path_options 再参考这个 https://nodejs.org/dist/latest-v7.x/docs/api/stream.html#stream_class_stream_readable 监听 data 事件就可以处理目标数据了。

牛 PowerShell 这么做

PowerShell 不会,我只会 Mac 和 Linux 的方法

我上面这个命令带上 -i 就直接删除该文件最前面的 1 千行

如果你要读指定行的话,可以用参数 p ,这命令直接输出到 stdout ,怎么接收看你了
sed -n ‘1001,2000p’ your_file

windows 下是没有原生 shell 的,参考 14 楼的方法现实些, readline 包也是可以的。

删掉原始文件出问题的时候真是会欲哭无泪,比较推荐 stream 读取然后写到新文件

我用了 readline 模块,用的是 html 页面中一个按钮(button)的 onclick 事件去触发这个基于 readline 模块的文件读取函数。但是我对每一行的处理包括一行修改 html 文件内容的命令。比如 html 页面中有个 <p id=“status”><p>。我希望每读取一行之后就利用 document.getElementById(“status”).innerHTML = line 覆盖 id=“status” 的段落原有内容为该行内容。但点击按钮之后,触发文件读取函数这时候页面卡住了,然后等函数运行结束,页面才恢复正常,于是我只看到了最后一行的显示内容。运气过程中“上一行内容被新的一行的内容覆盖”这个显示效果我就看不到了。

最终,是需要实现这样一个效果,示例代码: https://jsfiddle.net/09kuyn7v/ 。但不是像这个示例中那样,数据从数组中来,我需要的是从文件每一行读取出来,然后以同样的效果通过点击按钮显示到 html 的一个段落中去。

为什么 Mac 多个双引号,是干嘛的

那不是双引号,是两个单引号,用来备份 -i 直接修改的文件。比如你利用 sed -i ‘.bak’ ‘1,100d’ filename.txt 命令去删除 filename.txt 的前 100 行,中端会先备份文件为 filename.txt.bak

单引号内放空,看起来像双引号时就不备份

那看是怎么“轻松处理”,我的确可以用 readStrem 来读文件,但是我遇到的问题是读取文件之后无法动态地依次显示到 html 页面中去!

那是两个单引号,这个参数是用来定义重命名后缀的, 23 楼已说明
当你想直接写回原文件的时候, Linux 只写 -i 就好, Mac 下必须要带空字符串当参数,不然报错

我的想法是可以用 readFile 读出来,再用 split(’\n’)切割成数组,然后去掉前 1000 个元素。。

发文件就坑了

推荐使用 line-reader 这个包 直接读行,前 1000 行不处理,后面开始写入新文件
<br>var lineReader = require('line-reader');<br><br>lineReader.eachLine('file.txt', function(line, last) {<br> console.log(line);<br>});<br>

这个包读取文件是同步的还是异步的?

在 Node.js 中删除本地文件的前 1000 行内容,可以通过以下步骤实现:

  1. 读取文件内容。
  2. 移除前 1000 行。
  3. 将剩余内容写回文件。

下面是一个示例代码,展示了如何实现这一功能:

const fs = require('fs');
const readline = require('readline');

const filePath = 'yourfile.txt'; // 替换为你的文件路径
const linesToRemove = 1000;

async function removeFirstLines(filePath, linesToRemove) {
    const fileStream = fs.createReadStream(filePath);

    const rl = readline.createInterface({
        input: fileStream,
        crlfDelay: Infinity
    });

    let linesRemoved = 0;
    let remainingContent = '';

    for await (const line of rl) {
        if (linesRemoved >= linesToRemove) {
            remainingContent += line + '\n';
        } else {
            linesRemoved++;
        }
    }

    fileStream.close();

    fs.writeFileSync(filePath, remainingContent);
}

removeFirstLines(filePath, linesToRemove).then(() => {
    console.log('前 1000 行已删除');
}).catch(err => {
    console.error('发生错误:', err);
});

在这个示例中,我们使用 readline 模块逐行读取文件内容,并使用一个计数器 linesRemoved 来跟踪已经移除的行数。一旦达到指定的行数 linesToRemove,我们就开始收集剩余的内容,并最终将其写回文件。

请确保将 yourfile.txt 替换为你实际的文件路径,并根据需要调整 linesToRemove 的值。

回到顶部