网页抓图片java代码 java调用图片代码

用java写工具能否实现把网页的图片下载下来??

简单算法:

为嵩县等地区用户提供了全套网页设计制作服务,及嵩县网站建设行业解决方案。主营业务为成都做网站、成都网站制作、嵩县网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!

1)用readLine()依次读取html,如果eof则结束。

2)在string中搜索img,如果没有则跳转1

3)在img后搜索src,如果没有则跳转1

4) 在src后搜索",记录位置start,继续搜索",记录位置end。

5)从start到end的字符串就是图片的url,写到txt文件中。

6)重复1

Java中怎么抓取网页中的图片

通过httpclient来爬取网站内容,分析当前内容页中的图片‘规则’

抓取一般都是模拟浏览器访问目标网页,通过返回的页面html代码进行分析自己需要的数据

查找规则,例如你爬取的网页 ,看到当前页面显示的图片格式如下img src=""

通过解析爬取的网页源代码(html)进行字符串的操作即可,现在有相应的第三方jar包可以帮你更快的完成这部分工作,例如htmlpaser,获取到对应的地址,然后进行保存或下载。

你可以搜索,java爬虫(httpclient)和htmlpaser做更多的了解。

如何通过Java代码实现对网页数据进行指定抓取

通过Java代码实现对网页数据进行指定抓取方法步骤如下:

1在工程中导入Jsoup.jar包

2获取网址url指定HTML或者文档指定的body

3获取网页中超链接的标题和链接

4获取指定博客文章的内容

5获取网页中超链接的标题和链接的结果

如何用java代码获取 这个网页上的图片

你也没说是要把图片下载下来还是什么的

这里我实现的是将图片下载到电脑

import java.io.File;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStream;

import java.net.HttpURLConnection;

import java.net.MalformedURLException;

import java.net.URL;

public class DownLoad {

public static void main(String[] args) {

File dstFile = new File("E:/test/test/test.jpg");

try {

URL url = new URL("");

HttpURLConnection conn = (HttpURLConnection) url.openConnection();

InputStream is = conn.getInputStream();

saveFile(is, dstFile);

} catch (MalformedURLException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

}

public static void saveFile(InputStream is,File dstFile){

FileOutputStream fos = null;

File parentFile = dstFile.getParentFile();

if(!parentFile.exists()){

parentFile.mkdirs();

}

try {

fos = new FileOutputStream(dstFile);

byte[] buff = new byte[1024 * 4];

int len;

while((len = is.read(buff)) != -1){

fos.write(buff, 0, len);

}

} catch (FileNotFoundException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}finally{

try{

if(is != null){

is.close();

}

if(fos != null){

fos.close();

}

}catch(IOException e){

e.printStackTrace();

}

}

}

}

java 怎么实现网页截图

事实上,如果您想以Java实现网页截图,也就是“输入一段网址,几秒钟过后就能截取一张网页缩略图”的效果。那么,您至少有3种方式可以选择。

1、最直接的方式——使用Robot

方法详解:该方法利用Robat提供的强大桌面操作能力,硬性调用浏览器打开指定网页,并将网页信息保存到本地。

优势:简单易用,不需要任何第三方插件。

缺点:不能同时处理大量数据,技术含量过低,属于应急型技巧。

实现方法:使用如下代码即可。

[java] view plaincopy

public static void main(String[] args) throws MalformedURLException,  

IOException, URISyntaxException, AWTException {  

//此方法仅适用于JdK1.6及以上版本  

Desktop.getDesktop().browse(  

new URL("").toURI());  

Robot robot = new Robot();  

robot.delay(10000);  

Dimension d = new Dimension(Toolkit.getDefaultToolkit().getScreenSize());  

int width = (int) d.getWidth();  

int height = (int) d.getHeight();  

//最大化浏览器  

robot.keyRelease(KeyEvent.VK_F11);  

robot.delay(2000);  

Image image = robot.createScreenCapture(new Rectangle(0, 0, width,  

height));  

BufferedImage bi = new BufferedImage(width, height,  

BufferedImage.TYPE_INT_RGB);  

Graphics g = bi.createGraphics();  

g.drawImage(image, 0, 0, width, height, null);  

//保存图片  

ImageIO.write(bi, "jpg", new File("google.jpg"));  

}

2、最常规的方式——利用JNI,调用第三方C/C++组件

方法详解:目前来讲,Java领域对于网页截图组件的开发明显不足(商机?),当您需要完成此种操作时,算得上碰到了Java的软肋。但是,众所周知Java也拥有强大的JNI能力,可以轻易将C/C++开发的同类组件引为己用。不懂可以扣五七八零二四一四四

优势:实现简单,只需要封装对应的DLL文件,就可以让Java实现同类功能。

劣势:同其他JNI实现一样,在跨平台时存在隐患,而且您的程序将不再属于纯Java应用。

实现方法:可参见此用例,具体封装何种C/C++组件请自行选择。

PS:示例来源于ACA HTML to Image Converter项目( ),这是一个收费的HTML转Image第三方组件,但封装方式在Java中大同小异。

引用JNI封装:

[java] view plaincopy

import sun.awt.*;  

import java.awt.*;  

import javax.swing.*;  

import java.awt.event.*;  

import java.awt.*;  

import java.awt.peer.*;  

public class Snap  

{  

static  

{  

System.loadLibrary("Snap");  

}  

public static void main( String[] argv )  

{  

Snap t_xSnap = new Snap();  

t_xSnap.Start("", "snapshot-google.png");  

}  

public native void Start(String pi_strURL, String pi_strImageName);  

}  

CPP部分的实现:

[java] view plaincopy

#include windows.h  

#include atlbase.h  

#include "snap.h"  

#pragma comment(lib,"atl.lib")  

#import "./../../acawebthumb.dll" no_namespace  

JNIEXPORT void JNICALL Java_Snap_Start(JNIEnv *pEnv, jobject, jstring pi_strUrl, jstring pi_strFileName)  

{  

CoInitialize(0);  

_bstr_t t_strUrl = pEnv-GetStringUTFChars(pi_strUrl, 0);  

_bstr_t t_strFileName = pEnv-GetStringUTFChars(pi_strFileName, 0);      

IThumbMakerPtr HTML_Converter = NULL;  

HRESULT hr = HTML_Converter.CreateInstance(L"ACAWebThumb.ThumbMaker");      

if (SUCCEEDED(hr))  

{   

HTML_Converter-SetURL(t_strUrl);  

if ( 0 == HTML_Converter-StartSnap() )  

HTML_Converter-SaveImage(t_strFileName);  

}  

if (HTML_Converter)  

HTML_Converter.Release();  

CoUninitialize();           

}

以该组件图像化yahoo界面的效果图:

3、最扎实的方法——自行解析HTML标记,并将其图像化

方法详解:众所周知,HTML之所以在浏览器中以具体的网页格式出现,并非服务器端传了一整个应用到客户端,而是源自于浏览器对于客户端自行解析的结果。因此,只要我们将对应的解析一一实现,那么将网页图形化,就将不是什么难事。

优势:纯Java实现,一劳永逸,一旦开发完成则永远通用,而且有一定的商用价值。

劣势:开发费时,且需要针对不同语法做精确分析,才能保证输出的基本正确。尤其在涉及到JavaScript解析时,难度将尤其增大。

实现方法:目前尚无具体案例可供参考。但是,由于Java有jdic之类的浏览器项目存在(),而Java图形界面又属绘制生成。从理论上说,我们可以将所有具备Graphics的组件图形化保存。

而如果自行解析,那么您需要建立HTML解析器(或使用第三方的,万幸Java在这方面的组件很多),了解Java2D机制,了解何时该使用drawString绘制文字,何时又该使用drawImage插入图片等等。

谢谢采纳!


网站名称:网页抓图片java代码 java调用图片代码
本文来源:http://myzitong.com/article/hgoggs.html