پرش به مطلب اصلی

WebScraper

Web Scraper

تعریف

ابزاری که می‌تواند تمام اطلاعات یک صفحه وب را استخراج کند.


ورودی‌ها (Inputs)

  • URL: آدرس صفحه‌ای که می‌خواهید از آن داده استخراج کنید.
  • Whether to generate summary: از این گزینه برای تولید خلاصه‌ای از محتوای صفحه استفاده کنید.

خروجی‌ها (Outputs)

  • text: اطلاعات استخراج شده از صفحه مدنظر بصورت یک متن.

نحوه استفاده

از این ابزار زمانی استفاده کنید که نیاز دارید محتوای یک صفحه وب را استخراج کنید. می‌توانید کل محتوای صفحه یا نسخه خلاصه‌شده آن را بسته به نیاز خود دریافت کنید. این ابزار برای جمع‌آوری داده، تحقیق یا درک سریع محتوای صفحه بدون نیاز به مطالعه کامل آن مفید است.


مثال

توضیح: ابتدا در قسمت URL، آدرس صفحه مورد نظر خود را وارد کنید. این ورودی از نودهای قبلی یا از ورودی کاربر تامین میشود در اینجا ما یک متغییر با عنوان URL تعریف کرده و از آن استفاده میکنیم.

‼️ نکته: توجه داشته باشید ورودی به صورت یک لینک باشد. مانند:

https://www.wikipedia.org/

سپس انتخاب کنید که آیا می‌خواهید خلاصه‌ای از محتوای صفحه دریافت کنید یا کل محتوای آن را.

Input Parameters

در پایان محتوای استخراج‌شده به صورت متن در متغیر text(x) در دسترس خواهد بود.

Input Parameters