WebScraper
Web Scraper
تعریف
ابزاری که میتواند تمام اطلاعات یک صفحه وب را استخراج کند.
ورودیها (Inputs)
- URL: آدرس صفحهای که میخواهید از آن داده استخراج کنید.
- Whether to generate summary: از این گزینه برای تولید خلاصهای از محتوای صفحه استفاده کنید.
خروجیها (Outputs)
- text: اطلاعات استخراج شده از صفحه مدنظر بصورت یک متن.
نحوه استفاده
از این ابزار زمانی استفاده کنید که نیاز دارید محتوای یک صفحه وب را استخراج کنید. میتوانید کل محتوای صفحه یا نسخه خلاصهشده آن را بسته به نیاز خود دریافت کنید. این ابزار برای جمعآوری داده، تحقیق یا درک سریع محتوای صفحه بدون نیاز به مطالعه کامل آن مفید است.
مثال
توضیح:
ابتدا در قسمت URL، آدرس صفحه مورد نظر خود را وارد کنید. این ورودی از نودهای قبلی یا از ورودی کاربر تامین میشود در اینجا ما یک متغییر با عنوان URL تعریف کرده و از آن استفاده میکنیم.
‼️ نکته: توجه داشته باشید ورودی به صورت یک لینک باشد. مانند:
https://www.wikipedia.org/
سپس انتخاب کنید که آیا میخواهید خلاصهای از محتوای صفحه دریافت کنید یا کل محتوای آن را.
در پایان محتوای استخراجشده به صورت متن در متغیر text(x) در دسترس خواهد بود.
