Menu Close

Hack Web mà không cần trình duyệt

Đó là một vấn đề truyền thống. Bạn muốn dữ liệu để sử dụng trong chương trình của bạn, tuy nhiên nó nằm trên một trang web. Một số trang web có một API, tất nhiên, tuy nhiên, thông thường, bạn đang ở một mình. Bạn có thể tấn toàn bộ trang thông qua HTTP cũng như phân tích cú pháp. Hoặc bạn có thể sử dụng một số công cụ để “Scrape” trang web. Một phương thức hấp dẫn để làm điều này là WOOB – Web bên ngoài trình duyệt.

Hệ thống sử dụng một loạt các phụ trợ phù hợp tại các trang web cụ thể. Có một bộ sưu tập các phụ trợ chính thức, cũng như bạn cũng có thể tự sản xuất. Khi bạn có một phụ trợ, bạn có thể định cấu hình nó cũng như sử dụng nó từ Python. Dưới đây là một ví dụ về việc khám phá số dư tài khoản ngân hàng:

>>> từ woob.core nhập woob
>>> từ woob.capabilities.bank nhập capbank
>>> w = woob ()
>>> w.load_backends (capbank)
{‘Societegenerale’: , ‘CreditMutuel’: }
>>> print (danh sách (w.iter_accounts ()))
[,
,
]
>>> acc = tiếp theo (iter (w.iter_accounts ()))
>>> acc.Balance.
Thập phân (’87 .32 ‘)
Tuy nhiên, danh sách các phụ trợ được cung cấp rất ấn tượng, tuy nhiên, cuối cùng bạn sẽ muốn sản xuất các mô-đun của riêng mình. Rất may, có rất nhiều tài liệu về chính xác làm thế nào để làm điều đó. Khung cho phép bạn xuất bản dữ liệu đến trang web cũng như nhanh chóng kiểm tra kết quả. Mỗi phần phụ trợ cũng có một bài kiểm tra có thể tìm thấy nếu một sửa đổi trong trang web phá vỡ mã, đó là một vấn đề điển hình với các lược đồ như vậy.

Chúng tôi đã không nhìn thấy một phụ trợ của Hackaday. cũng xấu. Tuy nhiên, có nhiều ví dụ ứng dụng, cả hai đều dựa trên bảng điều khiển cũng như sử dụng QT. Ví dụ: bạn có thể duyệt phim, xử lý các công thức nấu ăn hoặc trang web hẹn hò.

Tất nhiên, có nhiều phương pháp có thể xảy ra với vấn đề này. Có lẽ bạn yêu cầu khám phá khi tàu tiếp theo rời đi.

Leave a Reply

Your email address will not be published. Required fields are marked *