如何使用 Nodejs 删除本地文件前 1000 行内容?
如何使用 Nodejs 删除本地文件前 1000 行内容?
我是一个 nodejs 新手,由于某种原因必须利用 nodejs 简单快速地写一个处理文件内容的小小 app 。我看过 nodejs documentation ,有些懵逼,所以偷个懒来 V 站问一下大家。。
目的是想读取一个包含超多行数的文件,并对每一行内容做一些操作。如果全部读取的话内存不够,打算用一个循环去读取文件内容,每次读 1000 行,对这 1000 行数据进行一些处理之后,删除原文件前 1000 行内容,保证下一次循环不重复读取内容。
有没有人能告诉我删除本地文件的前 1000 行在 nodejs 中该如何实现?
PS. 我试过 nodejs 的 readStream 模块去一行一行地读取。但是这个方法有一些小毛病,我不想考虑了。如果可以的话,能帮忙解决一下我问的上一个问题也可:请问如何使用 nodejs 的 readline 模块按行读取文件内容然后依次更新到 html 页面中?
PS 的 PS. 如果能用 shell script 做是超简单的,一个 sed -i '1,1000d' filename.txt 就搞定了,然而不得不用 nodejs。。
可以用 node 开子进程执行 shell ?
我需要在 Windows 下用 node-webkit 写 web app , Windows 下可以用 shell 子进程不?
可以跨平台执行 shell 命令
我怎么感觉方向不对
这种事用 shell
linux:
sed -i -n ‘1,1000d’ your_file
mac:
sed -i ‘’ -n ‘1,1000d’ your_file
没有接触过 socket.io ,不想现学了。
这个 shelljs 看起来很棒啊,我对 shell script 很熟,如果能在 nodejs 里执行 shell script 就太好啦。我马上去试试,超感谢。
你这个思路不对啊。不可能从一个文件的头部删除一千行,能实现的方法都是把 1000 行后的内容写到新文件,然后用新文件覆盖掉旧文件
那不对啊 前 1000 行读出来了 第二个一千行不行啊。
哇, sheeljs ,现在这个 js 啊,真的搞事情。
如果“目的是想读取一个包含超多行数的文件,并对每一行内容做一些操作”,那无论你文件多大, nodejs 都可以轻松处理啊! nodejs 可以流式读取文件, see https://nodejs.org/dist/latest-v7.x/docs/api/fs.html#fs_fs_createreadstream_path_options 再参考这个 https://nodejs.org/dist/latest-v7.x/docs/api/stream.html#stream_class_stream_readable 监听 data 事件就可以处理目标数据了。
牛 PowerShell 这么做
PowerShell 不会,我只会 Mac 和 Linux 的方法
我上面这个命令带上 -i 就直接删除该文件最前面的 1 千行
如果你要读指定行的话,可以用参数 p ,这命令直接输出到 stdout ,怎么接收看你了
sed -n ‘1001,2000p’ your_file
windows 下是没有原生 shell 的,参考 14 楼的方法现实些, readline 包也是可以的。
我用了 readline 模块,用的是 html 页面中一个按钮(button)的 onclick 事件去触发这个基于 readline 模块的文件读取函数。但是我对每一行的处理包括一行修改 html 文件内容的命令。比如 html 页面中有个 <p id=“status”><p>。我希望每读取一行之后就利用 document.getElementById(“status”).innerHTML = line 覆盖 id=“status” 的段落原有内容为该行内容。但点击按钮之后,触发文件读取函数这时候页面卡住了,然后等函数运行结束,页面才恢复正常,于是我只看到了最后一行的显示内容。运气过程中“上一行内容被新的一行的内容覆盖”这个显示效果我就看不到了。
最终,是需要实现这样一个效果,示例代码: https://jsfiddle.net/09kuyn7v/ 。但不是像这个示例中那样,数据从数组中来,我需要的是从文件每一行读取出来,然后以同样的效果通过点击按钮显示到 html 的一个段落中去。
为什么 Mac 多个双引号,是干嘛的
那不是双引号,是两个单引号,用来备份 -i 直接修改的文件。比如你利用 sed -i ‘.bak’ ‘1,100d’ filename.txt 命令去删除 filename.txt 的前 100 行,中端会先备份文件为 filename.txt.bak
单引号内放空,看起来像双引号时就不备份
那看是怎么“轻松处理”,我的确可以用 readStrem 来读文件,但是我遇到的问题是读取文件之后无法动态地依次显示到 html 页面中去!
那是两个单引号,这个参数是用来定义重命名后缀的, 23 楼已说明
当你想直接写回原文件的时候, Linux 只写 -i 就好, Mac 下必须要带空字符串当参数,不然报错
我的想法是可以用 readFile 读出来,再用 split(’\n’)切割成数组,然后去掉前 1000 个元素。。
大文件
推荐使用 line-reader 这个包 直接读行,前 1000 行不处理,后面开始写入新文件<br>var lineReader = require('line-reader');<br><br>lineReader.eachLine('file.txt', function(line, last) {<br> console.log(line);<br>});<br>
这个包读取文件是同步的还是异步的?
在 Node.js 中删除本地文件的前 1000 行内容,可以通过以下步骤实现:
- 读取文件内容。
- 移除前 1000 行。
- 将剩余内容写回文件。
下面是一个示例代码,展示了如何实现这一功能:
const fs = require('fs');
const readline = require('readline');
const filePath = 'yourfile.txt'; // 替换为你的文件路径
const linesToRemove = 1000;
async function removeFirstLines(filePath, linesToRemove) {
const fileStream = fs.createReadStream(filePath);
const rl = readline.createInterface({
input: fileStream,
crlfDelay: Infinity
});
let linesRemoved = 0;
let remainingContent = '';
for await (const line of rl) {
if (linesRemoved >= linesToRemove) {
remainingContent += line + '\n';
} else {
linesRemoved++;
}
}
fileStream.close();
fs.writeFileSync(filePath, remainingContent);
}
removeFirstLines(filePath, linesToRemove).then(() => {
console.log('前 1000 行已删除');
}).catch(err => {
console.error('发生错误:', err);
});
在这个示例中,我们使用 readline
模块逐行读取文件内容,并使用一个计数器 linesRemoved
来跟踪已经移除的行数。一旦达到指定的行数 linesToRemove
,我们就开始收集剩余的内容,并最终将其写回文件。
请确保将 yourfile.txt
替换为你实际的文件路径,并根据需要调整 linesToRemove
的值。