BTOイノベーション

自作PC、BTOパソコン、プログラミングなど初心者目線を大事に

スクレイピングとは!?急にサイトにアクセスできなかった話

スポンサーリンク

f:id:satokibi6:20190803093619j:plain

 

最近、アンテナサイトを使っていろいろと作業しております。

先日急にそのサイトにアクセスできなくなりました。

原因がわからず試行錯誤の末にたどり着いた結論を備忘録的に残しておきたいと思いました。

 

手動なのに勝手にスクレイピング扱い!?

結論からお伝えしますと特にシステム的なことはしていないのに勝手に?スクレイピング扱いとなってしまい、アクセス拒否されておりました。

自身のパソコンの設定かと思っていたのに意外なところに盲点がありました。実際にプログラミングの書籍などは買って知っていていつかは実践したみたいなと思っていただけで実際に不正アクセスと見なされていたとは驚きでした。

 

f:id:satokibi6:20190803085724p:plain

 

念のため、サイトの管理人に同じような人はいませんか?と見当違い承知での連絡をしたのですが本当に意外な回答でした。

ここだったかとなんとなく?原因判明したのは自身の今後のプラスと捉えておきたいと考えています。

 

スクレイピングとは?

スクレイピングとは、WebページのHTMLを解析して、目的のデータを抜き出して取得する方法です。


これをパソコンでプログラミングして半自動的に情報収集する手法です。

先日からはじめたプログラミング言語のPythonでもできるようです。

 

www.btoinov.com

 

こちらに関しては今後、作業したらブログでも書いていきたいと思います。

 

このサイトにはアクセスできません?

突然、管理画面にアクセスができなくなりあれ?と思っていました。

そのうち、通常のサイトにすらアクセスできないことに気づきます。

 

f:id:satokibi6:20190803091226p:plain

スマホでWifi環境を切断した状態ではアクセスが可能だったので自宅のPC環境というところまではなんとか行き着きました。

 

f:id:satokibi6:20190803091520p:plain

 

次にこんな画面を確認できたのでいろいろと試行錯誤の末、プロパイダ会社に問い合わせをしてみることに。

 

ルーター内にフィルタがかかっているか確認!

特に障害などはなく調べていただいてアクセスができることは確認していただき、ルーターの設定かもしれませんねとの回答を得てルーター内の設定を見直しましたが現状のままでした。

 

ポート443とは?

エラー画面のポート443というのはhttps;へのアクセスする際に必要な情報とのことです。

とくに設定不要らしくこれもそのままでした。

 

最終手段!OSの再インストール

まったく解消する気配がないので最終手段として設定をすべて消してしまえば直るのではという考えにいたります。

まっさらな状態にしましたが改善せずでした。

これをしたことによる代償を大きかったです。

・録画データの削除

・すべてのソフトのインストール

などなど。

結構な作業時間を費やしています。

 

一度、再出発という意味としては整理整頓できたのでよかったかなと感じたりというか前向きに考えました。

 

IPアドレスは自動取得ではすぐには変わらないもの?

IPアドレスは自動取得となっており、いろいろなサイトを見ると結構な頻度で書き換えができるみたいなことが書いてあり、コマンドプロンプトで再取得できたりしますが

プロパイダごとに扱いが違うみたいです。

ルーターを取り替えたのがちょうど2年くらい前で確認したらちょうど2年前からIPアドレスは変更されていませんでした。

たぶん、ここを変更できればアクセスはできるのかなと思います。

現在、調査中です。

 

スクレイピングとは!?急にサイトにアクセスできなかった話 まとめ

今回は急にアクセスができなくなった話をまとめてみました。

なかなか素人が急にいろいろなことをすると対応する選択肢は限られているので盲点という部分が大きかったです。

サイトに駄目もとで確認した今回の原因が発見できたのでよかった?のかなと。

OSの整理など余計な手間をかけずに最初から聞くのも手だったのかなと。

もし、今後はこのような事態があれば対応はしやすいかなと思っています。

また、Python関係の記事も更新いきます。