Как найти и отображение гиперссылок, содержащихся в веб

Приложение Java написано ниже используются регулярные выражения для поиска и отображения гиперссылок, содержащихся в веб-страницу. После компиляции файла, вы должны сохранить веб-страницу в ту же папку, которая содержит ShowLinks.class.


import java.io.*;

import java.util.regex.*;



public class ShowLinks {

    public static void main(String[] arguments) {

        if (arguments.length < 1) {

            System.out.println("Usage: java ShowLinks [page]");

            System.exit(0);

        }

        String page = loadPage(arguments[0]);

        Pattern pattern = Pattern.compile("<a.+href=\"(.+?)\"");

        Matcher matcher = pattern.matcher(page);

        while (matcher.find()) {

            System.out.printlnmatcher.group(1));

        }

    }



    private static String loadPage(String name) {

        StringBuffer output = new StringBuffer();

        try {

            FileReader file = new FileReader(name);

            BufferedReader buff = new BufferedReader(file);

            boolean eof = false;

            while (!eof) {

                String line = buff.readLine();

                if (line == null)

                    eof = true;

                else

                    output.append(line + "\n");

            }

            buff.close();

        catch (IOException e) {

            System.out.println("Error -- " + e.toString());

        }

        return output.toString();

    }

}

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>