pythonを使用してUSRNステートメントを読み取り可能な形式にする方法



FSIS USRNRosreestrに遭遇した人の厄介で困難な道。彼は、ブラウザがロードされるのを無限に待っている、キー、キャプチャ、5分のリクエストの間隔を待っています。なぜ彼はそんなに苦しんでいるのですか?このシステムを使用して抽出物を注文することを決定したとき、彼はすでに自分のお金を寄付していました。しかし、違います。USRNから抽出物を取得することは、玉ねぎを脱ぐようなものです。被害者を待つ最後のステップ-ダウンロードされ、切望された抽出物は、zipアーカイブで表されます。このアーカイブには、別のアーカイブとsigファイルが含まれています。そして、ステートメントファイル自体はすでに中にあります。しかし、それを読むのも簡単ではありません-それはxmlにあります。そして、すべてが一緒に成長するためには、このxmlをsigと一緒にRosreestrの特別なページにダウンロードする必要があります。そしてそこには、まだ捕虜が待っています。そして、各ステートメントで!今日は、pythonを使用してこの最後の痛みを克服します。



仕事:



  • フォルダ内のすべてのzipを解凍します。
  • 仕様でダウンロードします。Rosreestrへのリンク、
  • 最後に、ステートメントの人間が読めるビューである!をダウンロードします。


したがって、最初にフォルダに抽出物のzipアーカイブがダウンロードされます







。pythonモジュールをインポートした後:



import os
import zipfile
import webbrowser,time
from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains


内容と混同しないように、すべてのzipアーカイブを解凍して削除しましょう。



zipFiles = []
sigFiles = []
for filename in os.listdir('.'):
    if filename.endswith('.zip'):        
        zipfile.ZipFile(filename, 'r').extractall()
        os.remove(filename)


それらのzipアーカイブとsigファイルを取得し、それらをRosreestr Webサイトにアップロードし







ます。ディレクトリ内のすべてのファイル(私の場合は「C:/ 2」)のメインプログラムループに移動します。



for filename in zipFiles:    
    act = browser.find_element_by_id('sig_file')
    act.send_keys('C:\\2\\'+str(filename)+'.sig')
    act = browser.find_element_by_id('xml_file')
    # zip 
    zip_ref = zipfile.ZipFile(filename, 'r').extractall()
    # xml  
    for f in os.listdir('.'):
        if f.endswith('.xml'):
            print(f)
    # xml   
            act.send_keys('C:\\2\\'+str(f))    
    act = browser.find_element_by_css_selector('input.brdg1111')
    act.click()
    i = str(input(" : "))
    for b in i:
        act.send_keys(b)
        time.sleep (0.1)
    #act.submit()
    act = browser.find_element_by_css_selector('.terminal-button-bright')
    act.click()
    time.sleep (5)
    
    try:
        act = browser.find_element_by_link_text('   ')
        act.click()


Rosreestrポータルページrosreestr.gov.ru/wps/portal/cc_vizualisationが正常に読み込まれると、プログラムはディレクトリ内のzipアーカイブを検索し、そこからxmlステートメントファイルを取得して、Webサイトの必須フィールドに挿入します。プログラムは、xmlに添付されたsigファイルでも同じことを行います。







次に、プログラムは、captchaが入力されるのを待ち







ます。ユーザーがcaptchaを入力した後、それをサイトに送信し、USRNからのすでに「通常の」抽出のダウンロードリンクをクリックし







ます。ウィンドウが開き、終了します。抽出。これは、htmlに保存するか、ChromeでCTRL + Pを押すことによって-pdfで保存できます。



自動解決のcaptchaと人間が読める抽出物の自動ダウンロードを追加することは残っています。しかし、これはここで最も簡単なことですよね?



プログラムコードはこちらです。



All Articles