歡迎來到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁 裝配圖網(wǎng) > 資源分類 > DOCX文檔下載  

JAVA爬蟲獲取網(wǎng)頁URL源碼

  • 資源ID:62092413       資源大?。?span id="7zvkrb5" class="font-tahoma">12.51KB        全文頁數(shù):4頁
  • 資源格式: DOCX        下載積分:0積分
快捷下載 游客一鍵下載
會(huì)員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺(tái)登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要0積分
郵箱/手機(jī):
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機(jī)號(hào),方便查詢和重復(fù)下載(系統(tǒng)自動(dòng)生成)
支付說明:
本站最低充值0.01積分,下載本資源后余額將會(huì)存入您的賬戶,您可在我的個(gè)人中心查看。
驗(yàn)證碼:   換一換

 
賬號(hào):
密碼:
驗(yàn)證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開,此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請(qǐng)使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預(yù)覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒有明確說明有答案則都視為沒有答案,請(qǐng)知曉。

JAVA爬蟲獲取網(wǎng)頁URL源碼

文檔供參考,可復(fù)制、編制,期待您的好評(píng)與關(guān)注! package fileAndStringOperate;import java.io.BufferedReader;import java.io.File;import java.io.FileOutputStream;import java.io.FileReader;import java.io.FileWriter;import java.io.IOException;import java.io.OutputStream;public class ReadFileToString public static void main(String args) throws IOExceptionString fileData = readtxt("D:IR1JAVA網(wǎng)絡(luò)爬蟲.txt");CountRelatedDocument(fileData);/MyWebRec myWebRec = new MyWebRec2000;ClassifyURL(fileData);private static String readtxt(String filePath) throws IOExceptionBufferedReader br=new BufferedReader(new FileReader(filePath);String str=""String r=br.readLine();while(r!=null)str+=r+"n"r=br.readLine();return str;private static char readtxtToChar(String filePath) throws IOExceptionchar data = null;int currentline = 0;BufferedReader br=new BufferedReader(new FileReader(filePath);String str=""String r=br.readLine();while(r!=null)str+=r+"n"datacurrentline+ = str.toCharArray();r=br.readLine();return data;private static int CountRelatedDocument(String fileData)int cntRelated = 0;int currentLine = 1;int baiduCnt = 0;int bingCnt = 0;int sogouCnt = 0;int _360Cnt = 0;int State = 0;boolean baiduY = new boolean51;boolean bingY = new boolean51;boolean sogouY = new boolean51;boolean _360Y = new boolean51;char fileChar = fileData.toCharArray();for(int i = 0; i < fileChar.length;i +)if(fileChari = '#' && fileChari+1 = '*')State+;System.out.println("分點(diǎn):"+currentLine);if(fileChari = 'n')currentLine +;if(currentLine %3 = 0)if(fileChari = 'Y'|fileChari = 'y')if(State = 1)baiduCnt +;baiduYcurrentLine/3 = true;else if(State = 2)bingCnt +;bingYcurrentLine/3 - 50 = true;/System.out.println(currentLine/3 - 50);else if(State = 3)sogouCnt +;sogouYcurrentLine/3 - 100 =true;else if(State = 4)_360Cnt +;_360YcurrentLine/3 - 150 = true;cntRelated+;tryCaculatePR(baiduY,bingY,_360Y,sogouY,cntRelated);catch(Exception e)e.getMessage();System.out.println("cntRelated = "+cntRelated);System.out.println("baiduCnt = "+baiduCnt);System.out.println("bingCnt = "+bingCnt);System.out.println("sohuCnt = "+sogouCnt);System.out.println("_360Cnt = "+_360Cnt);System.out.println("currentLine = " + currentLine);return cntRelated;private static void ClassifyURL(String fileData)String str1 = fileData.split("n");for(int i = 0;i < str1.length;i +)if(str1i.startsWith("#*")str1i = str1i.substring(10);private static void CaculatePR(boolean baiduY,boolean bingY,boolean _360Y,boolean sogouY,int cntRelated) throws IOExceptiondouble baiduP = new double 51;double baiduR = new double 51;double bingP = new double 51;double bingR = new double 51;double sogouP = new double 51;double sogouR = new double 51;double _360P = new double 51;double _360R = new double 51;int cntBaidu = 0;int cntBing = 0;int cntSogou = 0;int cnt360 = 0;/System.out.println("Related:"+cntRelated);for(int i = 1;i <= 50;i +)if(baiduYi = true)cntBaidu +;if(bingYi = true)cntBing +;if(sogouYi = true)cntSogou +;if(_360Yi = true)cnt360 +;baiduPi = 1.000000*cntBaidu/i;baiduRi = 1.000000*cntBaidu/cntRelated;bingPi = 1.000000*cntBing/i;bingRi = 1.000000*cntBing/cntRelated;sogouPi = 1.000000*cntSogou/i;sogouRi = 1.000000*cntSogou/cntRelated;_360Pi = 1.000000*cnt360/i;_360Ri = 1.000000*cnt360/cntRelated;/System.out.print(cntBaidu+"t"+cntBing+"t"+cntSogou+"t"+cnt360+"n");CaculateMAP(baiduP,bingP,sogouP, _360P);File file = new File("D:/JAVA網(wǎng)絡(luò)爬蟲.txt");FileWriter out = new FileWriter(file); /文件寫入流 /將數(shù)組中的數(shù)據(jù)寫入到文件中。每行各數(shù)據(jù)之間TAB間隔 for(int i=1;i<=50;i+) out.write("baidu"+"t"+baiduPi+"t" + baiduRi+"rn"); for(int i=1;i<=50;i+) out.write("bing"+"t"+bingPi+"t" + bingRi+"rn"); for(int i=1;i<=50;i+) out.write("sogou"+"t"+sogouPi+"t" + sogouRi+"rn"); for(int i=1;i<=50;i+) out.write("360"+"t"+_360Pi+"t" + _360Ri+"rn"); out.close();private static void CaculateMAP(double baiduP,double bingP,double sogouP,double _360P)double baiduPre=0,bingPre=0,sogouPre=0,_360Pre=0;for(int i = 1;i <= 50;i + )baiduPre += baiduPi;bingPre += bingPi;sogouPre += sogouPi;_360Pre += _360Pi;baiduPre /= 50;bingPre /= 50;sogouPre /= 50;_360Pre /= 50;System.out.println("baidu:"+baiduPre+"bing:"+bingPre+"sogou:"+sogouPre+"360:"+_360Pre);4 / 4

注意事項(xiàng)

本文(JAVA爬蟲獲取網(wǎng)頁URL源碼)為本站會(huì)員(文***)主動(dòng)上傳,裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng)(點(diǎn)擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因?yàn)榫W(wǎng)速或其他原因下載失敗請(qǐng)重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!