初入Nodejs，被一个题困惑了，求解答

当然可以！让我们来详细解析一下这个问题。

问题背景

在Node.js中，处理HTTP请求时可能会遇到一些常见的陷阱。特别是在使用流（Stream）进行数据处理时，如果处理不当，可能会导致一些意想不到的结果。

示例代码

假设我们有一个简单的HTTP服务器，它接收客户端发送的数据，并将这些数据通过一个through模块（用于处理流）处理后返回给客户端。

错误的实现方式

const http = require('http');
const through = require('through2');

let stream = through();

http.createServer((req, res) => {
    req.pipe(stream).pipe(res);
}).listen(8080);

console.log('Server is running on port 8080');

在这个例子中，我们定义了一个全局的stream对象，并且在每次HTTP请求时都使用这个全局的stream对象。这样做会导致所有请求共享同一个流对象，从而可能导致数据混乱或丢失。

正确的实现方式

const http = require('http');
const through = require('through2');

http.createServer((req, res) => {
    let stream = through();
    req.pipe(stream).pipe(res);
}).listen(8080);

console.log('Server is running on port 8080');

解释

错误的实现方式：
- 我们定义了一个全局的stream对象。
- 在每次HTTP请求时，我们使用这个全局的stream对象。
- 这样做会导致所有请求共享同一个流对象，可能会导致数据混乱或丢失。
正确的实现方式：
- 每次HTTP请求时，我们都会创建一个新的stream对象。
- 这样每个请求都有独立的流对象，不会相互干扰。

总结

在处理HTTP请求时，尤其是在使用流（Stream）时，务必确保每个请求都有自己独立的流对象。否则，可能会导致数据混乱或丢失。通过创建局部变量而不是全局变量，可以避免这种问题。

希望这个解释对你有所帮助！如果你有任何进一步的问题，请随时提问。

nodeper 2楼

一语点醒了我,答案确实对于每一次的http请求都创建了一个through对象.这也许是造成错误的原因. 我猜测原因是这样的 : 题目中提到了This is great because our server can response immediately without buffering everything in memory first. 这句话说明 through是没有缓存机制的(没有存入内存),如果多个http并发请求共有一个through对象来处理,可能会发生有内容丢失.

vueper 3楼

我觉得我发现问题了。

你可以自己重新写一份代码，像这样

var http = require('http');
var through = require('through');
var server = http.createServer(function (req, res) {
if (req.method === ‘POST’) {
req.pipe(through(function (buf) {
this.queue(buf.toString().toLowerCase());
})).pipe(res);
}
else res.end(‘send me a POST\n’);
});
server.listen(parseInt(process.argv[2]));

这份代码和标准答案的唯一区别是输出小写。

然后你可以发现你还是可以通过测试。

然后，通过阅读stream-adventures的代码，我发现问题。

在nodeschool的verify框架中，verify功能作为一个函数实现，这个函数接受两个函数（a和b）和其他参数作为参数，verify首先调用a，b函数分别创建两个流，a是测试流，b是标准答案流。而在每个问题的目录下面会有一个setup.js，这个js在正式调用verify前被调用，将会创建verify所需要的参数，包括a函数和b函数。

在stream-adventures/problems/http_server/setup.js中，创建的参数是这样的：

return {
        a: function (args) { return run(args, aPort) },
        b: function (args) { return run(args, bPort) },
        close: function () { close.forEach(function (f) { f() }) }
};

可以清晰的看到a函数和b函数的定义

而run函数的实现如下：

function run (args, port) {
        var ps = spawn(process.execPath, args.concat(port));
        ps.stderr.pipe(process.stderr);
        close.push(function () { ps.kill() });
    var stream = check(aPort);
    if (opts.run) {
        ps.stdout.pipe(process.stdout);
        stream.on('end', function () { ps.kill() });
    }
    return stream;
}

其中check函数，经过我的阅读，实际功能为创建一个输入输出流，向指定端口的服务器发送测试数据，并且将测试结果写入流中待测试。

这其中的bug就很明显了。创建check流的时候，代码为var stream = check(aPort);这就意味着a函数和b函数创建的测试流是同一个流，标准代码根本就没有被测试。在改为var stream = check(port);后，工作正常。

然后回过来看看为什么你的代码（实际是正确的）在这种情况下不能正常工作。

实际多次测试后，我们可以发现LZ所列举的错误情况并不是唯一的，也会出现多次错对交替。在这个模型下，两个客户端几乎同时开始运行，然后开始向服务器发送相同的测试数据。由于你使用全局的trough对象，这个时候a流发送的东西可能流向a流或者b流，b流也是如此，所以说能对能错完全看调度了。。。基本是靠缘分。在使用了标准答案后，由于之前提到的原因，不会造成流混乱，也就可以通过测试。

gougou168 4楼

嗯嗯,好详细的回复啊,非常感谢,我先消化一下您的回复.

eggper 5楼

才初学,我得慢慢笑话了,不过setup函数应该有点问题,既然都传了port参数,里面却是用了aport…

phonegap100 6楼

根据你提供的信息，看起来你是在使用Node.js处理HTTP请求时遇到了问题，特别是在使用through模块来处理流数据时。

简单来说，through是一个简单的流转换模块，可以让你方便地在可读流和可写流之间进行数据转换。在处理HTTP请求时，每个请求应该是独立的，应该为每个请求单独创建流对象以避免状态冲突或数据混淆。

以下是一个简单的示例，展示如何为每个HTTP请求创建一个新的through对象：

const http = require('http');
const through = require('through2');

const server = http.createServer((req, res) => {
    if (req.method === 'POST') {
        const transform = through((buf, enc, next) => {
            this.push(buf.toString().toUpperCase());
            next();
        });

        req.pipe(transform).pipe(res);
    } else {
        res.end('send me a POST\n');
    }
});

server.listen(6789, () => {
    console.log('Server is listening on port 6789');
});

在这个例子中，我们创建了一个HTTP服务器，它监听6789端口。当接收到POST请求时，我们创建了一个新的through对象（transform），并将其插入到请求流和响应流之间。这样做的目的是确保每次请求都有一个独立的流对象，避免了数据之间的干扰。

通过这种方式，我们可以确保每个HTTP请求的数据转换是独立且正确的。如果你使用的是全局的through对象，可能会导致不同请求之间的数据混杂在一起，从而导致错误的结果。

希望这能帮助你理解为什么需要为每个请求创建一个新的through对象。如果你还有其他疑问，请随时提问。