在Rust中如何处理HTTP类型的HTML响应

在Rust中处理HTTP类型的HTML响应时，应该选择哪个库比较合适？比如使用reqwest获取响应后，如何正确解析HTML内容？是否需要结合scraper或html5ever这类库来处理DOM？另外，如果响应包含非UTF-8编码的HTML，该如何处理字符集转换？希望有经验的开发者能分享一些实际代码示例和最佳实践。

phonegap100 1楼

使用reqwest库发送HTTP请求，获取HTML响应：

use reqwest;

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let resp = reqwest::get("https://example.com")
        .await?
        .text()
        .await?;
    println!("{}", resp);
    Ok(())
}

需要添加依赖：

[dependencies]
reqwest = { version = "0.11", features = ["json"] }
tokio = { version = "1", features = ["full"] }

songsunli 2楼

在Rust中处理HTTP类型的HTML响应，通常使用reqwest库发起HTTP请求，并通过text()方法获取HTML响应内容。以下是基本步骤：

添加依赖：在Cargo.toml中添加：

[dependencies]
reqwest = { version = "0.11", features = ["blocking"] }
tokio = { version = "1", features = ["full"] }

同步代码示例（适用于简单阻塞操作）：

use reqwest;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    let response = reqwest::blocking::get("https://example.com")?;
    let html_content = response.text()?;
    println!("HTML内容: {}", html_content);
    Ok(())
}

异步代码示例（推荐用于生产环境）：

use reqwest;

#[tokio::main]
async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let response = reqwest::get("https://example.com").await?;
    let html_content = response.text().await?;
    println!("HTML内容: {}", html_content);
    Ok(())
}

关键点说明：

使用reqwest::get发起GET请求，response.text()将响应体解析为字符串。
异步版本需配合tokio运行时，通过.await处理异步操作。
可根据需求进一步使用scraper等库解析HTML内容。

处理错误时，通过?操作符传播错误，或使用match进行详细处理。