※上記の広告は60日以上更新のないWIKIに表示されています。更新することで広告が下部へ移動します。

リンク ※注意ウィルス含

一言で言うと不信感

ロクリアンです。

今日はとても嫌な気分なので嫌な記事を書きます。

ゴミ人間が更にゴミ以下の文章を撒き散らしたんじゃあ最早死んだ方がいいということになるのでゴミはここに捨てておきました
僕の場合ゴミ箱よりも先にブタ箱に行きそうです。

電子辞書で快適にWeb小説を読むためのソフトをPerlで肩慣らしに作ってみました。
まだ一週間しかPerlについて勉強してないのでおかしなコードになってます。
文字コードの変換が未実装なのでまだ実用段階ではないです。

動作*

第一引数に一行ごとにURLを指定したテキスト
第二引数に対応するファイル名(拡張子不要)
を渡して起動するとページからテキストを抽出し、正規表現で投稿者の名前など不要な部分を削除してテキストファイルを作成する

use strict;
use warnings;
use HTML::ExtractContent;
use LWP::UserAgent;

open URL, "<$ARGV[0]";
my @url = <URL>;
open NAME, "<$ARGV[1]";
my @name= <NAME>;
my $count = 0;
my $url = 0;
foreach $url (@url){
my $agent = LWP::UserAgent->new;
my $res = $agent->get($url);

my $extractor = HTML::ExtractContent->new;
$extractor->extract($res->decoded_content);
print "Downloading,",$url,"\n";
open TMP, ">$count";
print TMP $extractor->as_text;
close TMP;

open WRITE, ">$name[$count].txt";
open TMP, "<$count";
my @tmp = <TMP>;
my $line = 0;
my $p = 0;
foreach $line (@tmp){
$_ = $line;
$p = s/^\d.*ID.*\n//g;
print WRITE $_;
}
close WRITE;
close TMP;
unlink $count;
    1. $count;
print "Succeed\n";
}
close NAME;
close URL;