2011年9月28日水曜日

groovyとjsoupでHTMLをテキスト化する

groovyとjsoupで指定したURLのHTMLをテキスト化するには、以下のコードのようにgetメソッドでHTMLを取得してtextメソッドでテキスト化します。
@Grab(group='org.jsoup', module='jsoup', version='1.6.1')
import org.jsoup.*
// htmlを取得してtextに変換
println Jsoup.connect("http://groovy.codehaus.org").get().text()

動作環境
groovy 1.8.2, JDK6 Update27, jsoup 1.6.1

0 件のコメント:

コメントを投稿