王朝网络
分享
 
 
 

如何提取网页中所有链接

王朝vc·作者佚名  2006-01-17
宽屏版  字体: |||超大  

如何提取网页中所有链接

作者:谭昕

下载本文示例源代码

见过“网际快车”的“使用网际快车下载全部链接”这个功能吗?想实现它,我们可以这样做:

IE有几个有用的接口,我们可以用它来提取网页所有链接。

一、基本原理

首先是用IHTMLDocument2的get_links,来获取IHTMLElementCollection接口,再通过IHTMLElementCollection来获取IHTMLAnchorElement,而IHTMLAnchorElement接口的get_href就是我们想要的,通过循环获取,我们就可以得到网页的所有链接了!

二、具体代码

{

TCHAR HostName[2*MAX_PATH];

CComPtr<IDispatch spDispatch;

CComQIPtr<IHTMLDocument2, &IID_IHTMLDocument2 pDoc2;

CComPtr<IHTMLElementCollection pElementCol;

CComPtr<IHTMLAnchorElement pLoct;

// TODO: Add your control notification handler code here

int n = m_LinksList.GetItemCount();//GetCount();

for (int i = 0; i < n; i ++){

IWebBrowser2 *pBrowser = (IWebBrowser2 *)m_LinksList.GetItemData(i);

if (pBrowser){

pBrowser-Release();

}

}

m_LinksList.DeleteAllItems();

m_LinksNum = 0;

Log("**************************************************************");

Log("\r\n");

if (m_spSHWinds){

int n = m_spSHWinds-GetCount();

for (int i = 0; i < n; i++){

_variant_t v = (long)i;

IDispatchPtr spDisp = m_spSHWinds-Item(v);

SHDocVw::IWebBrowser2Ptr spBrowser(spDisp); //生成一个IE窗口的智能指针

if (spBrowser){

if (SUCCEEDED(spBrowser-get_Document( &spDispatch)))

pDoc2 = spDispatch;

if(pDoc2!=NULL)

{

if (SUCCEEDED(pDoc2-get_links(&pElementCol)))

{

// AfxMessageBox("IHTMLElementCollection");

long p=0;

if(SUCCEEDED(pElementCol-get_length(&p)))

if(p!=0)

{

m_LinksNum = m_LinksNum+p;

UpdateData(FALSE);

for(long i=0;i<=(p-1);i++)

{

BSTR String;

_variant_t index = i;

if(SUCCEEDED(pElementCol-item( index, index, &spDispatch)))

if(SUCCEEDED(spDispatch-QueryInterface( IID_IHTMLAnchorElement,(void **) &pLoct)))

pLoct-get_href(&String);

ZeroMemory(HostName,2*MAX_PATH);

lstrcpy(HostName,_bstr_t(String));

m_LinksList.InsertItem(i,HostName);

m_LinksList.SetCheck(i,TRUE);

pLoct-get_hostname(&String);

ZeroMemory(HostName,2*MAX_PATH);

lstrcpy(HostName,_bstr_t(String));

if(lstrlen(HostName))

{

m_LinksList.SetItemText(i,1,HostName);

Log(HostName );

Log("\r\n");

}

}

}

}

}

}

}

}

}

本程序在VC7+WINXP下编译通过,详细请看源代码!

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
>>返回首页<<
推荐阅读
 
 
频道精选
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有