آموزش خواندن صفحات HTML در پایتون با کتابخانه BeautifulSoup

برای خواندن صفحات HTML در پایتون می توان از کتابخانه قدرتمند BeautifulSoup استفاده کرد. این کتابخانه به شما اجازه می دهد به راحتی در میان تگ های HTML جستجو کنید و اطلاعات مورد نظر خود مانند عنوان صفحه یا فهرست تیترهای موجود در آن را استخراج کنید.

نصب BeautifulSoup

برای نصب این کتابخانه و بسته های وابسته آن، می توانید از مدیر بسته Anaconda استفاده کنید:

خواندن فایل HTML در پایتون

در مثال زیر، ابتدا یک درخواست به یک آدرس اینترنتی (URL) ارسال می کنیم تا محتوای آن در محیط پایتون بارگذاری شود. سپس با استفاده از پارامتر html.parser کل فایل HTML را تجزیه می کنیم و در نهایت چند خط ابتدایی از آن را چاپ می کنیم:

اجرای کد بالا نتیجه ای مشابه زیر ایجاد می کند:

استخراج مقدار یک تگ

برای استخراج مقدار یک تگ از اولین نمونه موجود در HTML، می توان از کد زیر استفاده کرد:

اجرای کد بالا خروجی زیر را ایجاد می کند:

استخراج تمام نمونه های یک تگ

برای استخراج مقدار تمام نمونه های یک تگ، می توان از کد زیر استفاده کرد:

خروجی اجرای این کد به شکل زیر خواهد بود:

5/5 - (1 امتیاز)

راستی! برای دریافت مطالب جدید در کانال تلگرام یا پیج اینستاگرام سورس باران عضو شوید.

پکیج آموزش پیشرفته ASP.NET Core + طراحی فروشگاه اینترنتی
  • انتشار: ۱۹ مرداد ۱۴۰۴

دسته بندی موضوعات

آخرین محصولات فروشگاه

مشاهده همه

نظرات

بازخوردهای خود را برای ما ارسال کنید