主頁 > 知識(shí)庫 > C# 實(shí)現(xiàn)抓取網(wǎng)站頁面內(nèi)容的實(shí)例方法

C# 實(shí)現(xiàn)抓取網(wǎng)站頁面內(nèi)容的實(shí)例方法

熱門標(biāo)簽:十堰正規(guī)電銷機(jī)器人系統(tǒng) 外呼系統(tǒng)費(fèi)用一年 寧波自動(dòng)外呼系統(tǒng)代理 怎么給超市做地圖標(biāo)注入駐店 辦理400電話證件 巫師3為什么地圖標(biāo)注的財(cái)寶沒有 手機(jī)地圖標(biāo)注如何刪除 外呼系統(tǒng)代理品牌 世紀(jì)佳緣地圖標(biāo)注怎么去掉

抓取新浪網(wǎng)的新聞欄目,如圖所示:

使用 谷歌瀏覽器的查看源代碼: 通過分析得知,我們所要找的內(nèi)容在以下兩個(gè)標(biāo)簽之間:

復(fù)制代碼 代碼如下:

!-- publish_helper name='要聞-新聞' p_id='1' t_id='850' d_id='1' -->

內(nèi)容。。。。

!-- publish_helper name='要聞-財(cái)經(jīng)' p_id='30' t_id='98' d_id='1' -->


如圖所示:

內(nèi)容。。。。

使用VS建立一個(gè)如圖所示的網(wǎng)站:

我們下載網(wǎng)絡(luò)數(shù)據(jù)主要通過   WebClient 類來實(shí)現(xiàn)。

使用下面源代碼獲取我們選擇的內(nèi)容:

復(fù)制代碼 代碼如下:

protected void Enter_Click(object sender, EventArgs e)
        {
            WebClient we = new WebClient();  //主要使用WebClient類
            byte[] myDataBuffer;
            myDataBuffer = we.DownloadData(txtURL.Text);  //該方法返回的是 字節(jié)數(shù)組,所以需要定義一個(gè)byte[]
            string download = Encoding.Default.GetString(myDataBuffer);  //對(duì)下載的數(shù)據(jù)進(jìn)行編碼

          
            //通過查詢?cè)创a,獲取某兩個(gè)值之間的新聞內(nèi)容
            int startIndex = download.IndexOf("!-- publish_helper name='要聞-新聞' p_id='1' t_id='850' d_id='1' -->");
            int endIndex = download.IndexOf("!-- publish_helper name='要聞-財(cái)經(jīng)' p_id='30' t_id='98' d_id='1' -->");

            string temp = download.Substring(startIndex, endIndex - startIndex + 1);  //截取新聞內(nèi)容

            lblMessage.Text = temp;//顯示所截取的新聞內(nèi)容
        }


效果如圖:

最后: 除了把下載的數(shù)據(jù)保存為文本以外,還可以保存為 文件類型 和 流 類型。

復(fù)制代碼 代碼如下:

WebClient wc = new WebClient();
            wc.DownloadFile(TextBox1.Text, @"F:\test.txt");
            Label1.Text = "文件下載完成";

復(fù)制代碼 代碼如下:

WebClient wc = new WebClient();
            Stream  s =  wc.OpenRead(TextBox1.Text);

            StreamReader sr = new StreamReader(s);
            Label1.Text =  sr.ReadToEnd();

您可能感興趣的文章:
  • C#多線程爬蟲抓取免費(fèi)代理IP的示例代碼
  • c# 抓取Web網(wǎng)頁數(shù)據(jù)分析
  • C# 抓取網(wǎng)頁內(nèi)容的方法
  • c# HttpWebRequest通過代理服務(wù)器抓取網(wǎng)頁內(nèi)容應(yīng)用介紹
  • C#實(shí)現(xiàn)通過程序自動(dòng)抓取遠(yuǎn)程Web網(wǎng)頁信息的代碼
  • asp.net c# 抓取頁面信息方法介紹
  • c#根據(jù)網(wǎng)址抓取網(wǎng)頁截屏生成圖片的示例
  • 基于C#實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲 C#抓取網(wǎng)頁Html源碼
  • C#實(shí)現(xiàn)抓取和分析網(wǎng)頁類實(shí)例
  • c#批量抓取免費(fèi)代理并且驗(yàn)證有效性的實(shí)戰(zhàn)教程

標(biāo)簽:嘉興 山西 牡丹江 景德鎮(zhèn) 通遼 天門 泰州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《C# 實(shí)現(xiàn)抓取網(wǎng)站頁面內(nèi)容的實(shí)例方法》,本文關(guān)鍵詞  實(shí)現(xiàn),抓取,網(wǎng)站,頁面,內(nèi)容,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《C# 實(shí)現(xiàn)抓取網(wǎng)站頁面內(nèi)容的實(shí)例方法》相關(guān)的同類信息!
  • 本頁收集關(guān)于C# 實(shí)現(xiàn)抓取網(wǎng)站頁面內(nèi)容的實(shí)例方法的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章