vb.net抓网页数据 vb抓取网页数据

vb.net 获取网页script中的data值

html

创新互联公司专业IDC数据服务器托管提供商,专业提供成都服务器托管,服务器租用,西部信息服务器租用西部信息服务器租用,成都多线服务器托管等服务器托管服务。

head

titleTest/title

script language="VBScript" type="text/vbscript"

!--      '按钮事件

sub Test1_onClick()

msgbox document.getelementsbytagname("table")(0).innerText

end sub

sub Test2_onClick() '提取每单元文本

dim Text

'获取表格中的行集

set trs=document.getelementsbytagname("table")(0).getelementsbytagname("tr")

for each tr in trs  '遍历每行

for each td in tr.getelementsbytagname("td") '遍历每行中的每单元

text = text  td.innerText  vbtab  '每单元用制表符分隔

next

text =text  vbcrlf  '换行

next

msgbox text

end sub

--

/script

/head

body

table cellspacing="0" cellpadding="0" class="list1"

tbody

tr class="listtou"

td width="10%"日期/td

td width="10%"姓名/td

td width="10%"备注/td

/tr

/tbody

tr

td width="10%"2014-01-15 10:40:52/td

td width="10%"张山/td

td width="10%"32/td

/tr

tr

td width="10%"2014-01-16 10:40:52/td

td width="10%"李四/td

td width="10%"29/td

/tr

/table

div

input type="button" name="Test1" value="测试1" 

input type="button" name="Test2" value= "测试2"

/div

/body

/html

'主要是对htmlDocument对像的操作,我发现htmlDocument对象可以通过body.InnerHtml载入html文本也能解析,这样比webBrowser1方便,因为是同步的。

'你试试用webClient的downloadString下载网页文本,然后赋给htmlDocument对象下的body.InnerHtml。

'上面只是代码例子,只供参考。用ie打开,某些浏览器可能不支持。

VB.net 正则表达式提取网页内容

楼上的说法不对,正则式的作用就是匹配未知的一些东西,可以提取.

代码如下:

-----------

Imports System.Text.RegularExpressions

dim sHtml as string=网页内容'自己想办法获取,比如Doc.Body.InnerHtml

dim sResult1 as string=""'“听过哪些草原歌”

sResult1=Regex.Match(sHtml, "\[aA]{1}[ ]{1}class\=t[ ]{1}href.+\(.+)\\/[aA]{1}\").Groups(1).Value

'其余类推...

'保存进文件

大哥把分给我吧.求你了.祝你好运中500万

用Vb提取网页中的数据

VB中处理网页文件好象只有这个控件,它是IE的内核,功能已经很强大了.

你遇到的问题我估计是因为网页中使用了框架,你可以这么处理

因为框架网页其实也是由两个或更多的单独网页构成的,所以你也可以把构成框架网页的其中一个页单独打开来浏览,这样做后,就可以用webbrowser.document来取得数据了.

vba如何抓取网页上的数据

代码:

Private Sub CommandButton1_Click()

Dim IE As Object

Dim i As Integer

i = 1

'打开网页:创建一个IE对象,然后给一些属性赋值。Visible是可见性,navigate是网页地址

Set IE = CreateObject('internetexplorer.application')

With IE

.Visible = True

.navigate ''

'等待网页完全加载

Do Until .ReadyState = 4

DoEvents

Loop

'拷贝汉字到网页文本框,然后点击转换按钮,并取出转换结果

Do While Sheets('sheet1').Cells(i 1, 1).Value ''

'从IE.Document.all句柄中把页面上要使用的节点找出来。这里的方法是:

.document.all('source').Value 给以source为ID的文本框赋值

.document.all.tags('img')(1).Click 点击图片集合里的第二张图片

.document.all('to').Value 取出以to为ID的文本框内容

.document.all('source').Value = Sheets('sheet1').Cells(i 1, 1).Value

.document.all.tags('img')(1).Click

Do Until .ReadyState = 4

DoEvents

Loop

Sheets('sheet1').Cells(i 1, 2).Value = .document.all('to').Value

i = i 1

Loop

'关闭网页

.quit

End With

End Sub

代码解释:(见注释)

贴士:

1)VBA只能操作IE浏览器,原因就一句话:都是微软家的产品嘛

2)要先引用Micorsoft Internet Controls


标题名称:vb.net抓网页数据 vb抓取网页数据
文章链接:http://myzitong.com/article/hpseij.html