مطلب امروز ما به آموزش پروژه محور پایتون میپردازد که در آن از سورس کد چند پروژه استفاده شده و به صورت قدم به قدم، در طول این آموزش کدنویسی میشوند. این مطلب به مرور با پروژههای جدیدتر به روز خواهد شد و میتوانید هر از گاهی برای دریافت پروژههای جدید، به آن سر بزنید. برای این کار پیشنهاد میکنیم لینک آن را به bookmarkهای مرورگر خود اضافه کنید.
پیش نیاز این آموزش پروژه محور پایتون، آشنایی کلی با سینتکس این زبان برنامه نویسی و انجام پروژههای سادهتر پیش از این است. در پایان مطلب، لینک چند آموزش پروژه محور پایتون دیگر آورده شده است که در برخی از آنها به آموزش پروژه های پایتون برای مبتدیان پرداختهایم. برخی دیگر نیز شامل پروژههای پیشرفته هستند.
حالا بیایید آموزش را آغاز کنیم!
آموزش پروژه محور پایتون: تشخیص چهره (Face Detection)
در این بخش از آموزش پروژه محور پایتون، به شما نشان خواهیم داد که چگونه با استفاده از پایتون یک Face Detector ساده بسازید. ساختن برنامهای که چهرهها را شناسایی میکند، یک راه عالی برای شروع کار با تسکهای Computer Vision در یادگیری ماشین است. به همین دلیل، ما در اینجا یک راه بسیار آسان برای تشخیص چهره با پایتون به شما معرفی میکنیم.
همانطور که از عنوان این بخش پیداست، برنامهای برای تشخیص چهره با پایتون خواهیم نوشت. وقتی میگوییم برنامه، به این معنی است که شما میتوانید آن را مانند آموزش دادن به یک ماشین انجام دهید. من دوست دارم برای این آموزش پروژه محور پایتون، به جای برنامه نویسی از آموزش مدل استفاده کنم. در واقع این کاری است که در اینجا قرار است انجام دهم.
بهترین راه برای یادگیری هر چیزی، آموزش دیدن است. بنابراین، در حالی که به ماشینی برای تشخیص چهره آموزش میدهیم، خودمان نیز در حال یادگیری هستیم. اما قبل از شروع این کار، میخواهم تفاوت بین تشخیص چهره (Face Detection) و شناسایی چهره (Face Recognition) را با شما به اشتراک بگذارم.
Face Detection Vs Face Recognition
Face Detection و Face Recognition ممکن است بسیار شبیه به هم به نظر برسند، اما در واقعیت این دو یکی نیستند. بیایید تفاوت بین اینها را درک کنیم تا هیچ نکتهای از زیر دستمان در نرود.
Face Detection ، فرآیند تشخیص دادن چهرهها در تصاویر و ویدیوها است. این برنامه کاری جز یافتن چهرهها انجام نمیدهد. اما در Face Recognition ، برنامه چهرهها را پیدا میکند و میتواند تشخیص دهد که کدام چهره متعلق به کدام شخص است. بنابراین، کار بیشتری انجام میدهد. به عبارت دیگر، برنامه نویسی بیشتر و آموزش بیشتری در این فرآیند وجود دارد.
فرض کنید به خیابان نگاه میکنید و ماشینها در حال عبور هستند. Face Detection مانند این است که بگوییم جسم عبوری ماشین است. و Face Recognition مانند این است که بتوانیم مدل ماشین عبوری را تشخیص دهیم. در اینجا یک تصویر زیبا وجود دارد که تفاوت بین این دو را در عمل نشان میدهد.

در این مقاله، به آموزش پروژه محور پایتون در پروژه Face Detection ادامه خواهیم داد. اگر میخواهید Face Recognition را هم یاد بگیرید، در بخش نظرات کامنت بگذارید.
Face Recognition با پایتون
من از کتابخانه OpenCV در پایتون استفاده میکنم که به عنوان ابزار اصلی برای تسکهای Computer Vision در پایتون استفاده میشود. اگر در کار با OpenCV تازه کار هستید، این بهترین مورد برای شروع است.
کتابخانه OpenCV به راحتی و با استفاده از دستور pip قابل نصب است:
pip install opencv-python
پس از نصب این کتابخانه، باید به سادگی و با استفاده از دستور زیر آن را import کنید:
import cv2
کتابخانه OpenCV در پایتون دارای classifier های از پیش آموزشدیده بسیاری برای صورت، چشمها، لبخند و غیره است. این فایلهای XML در یک پوشه ذخیره میشوند. ما از مدل Face Detection استفاده خواهیم کرد. مدل classifier از قبل آموزش دیده را میتوانید از اینجا دانلود کنید.
پس از دانلود و ذخیره فایل در دایرکتوری، اجازه دهید آن را در برنامه Face Detection بارگذاری کنیم:
face_cascade = cv2.CascadeClassifier('face_detector.xml')
مرحله بعدی انتخاب تصویری است که میخواهید کد خود را روی آن آزمایش کنید. مطمئن شوید که حداقل یک چهره در تصویرتان وجود داشته باشد تا برنامه Face Detection بتواند حداقل یک چهره پیدا کند.
پس از انتخاب یک تصویر، اجازه دهید آن را در برنامه خود تعریف کنیم. مطمئن شوید که تصویر در همان دایرکتوری است که در آن کار میکنید:
img = cv2.imread('image.jpg')
تشخیص چهرهها (Detect Faces)
از کوتاه بودن کد Face Detection در این آموزش پروژه محور پایتون، شگفت زده خواهید شد. با تشکر از کتابخانه OpenCV ، این کدی است که چهرهها را در یک تصویر تشخیص میدهد:
faces = face_cascade.detectMultiScale(img, 1.1, 4)
آخرین مرحله، کشیدن مستطیل در اطراف چهرههای شناساییشده است که به راحتی با کد زیر قابل انجام است:
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
cv2.imwrite("face_detected.png", img)
print('Successfully saved')
به این ترتیب میتوانیم به راحتی چهره یا چهرههای موجود در تصویر را تشخیص دهیم. امیدوارم این پروژه در مورد Face Detection با پایتون به کار شما آمده باشد.

آموزش پروژه محور پایتون: تبدیل فایل PDF به متن
در این بخش از این آموزش پروژه محور پایتون، شما را با نحوه استخراج متن از فایلهای PDF با پایتون آشنا میکنم. استخراج متن از PDF کار آسانی نیست، و برای کدنویسی آن با پایتون کارهای زیادی باید انجام دهید. اما من برای تسهیل کار، از یک پکیج پایتون به نام pdf2image استفاده میکنم که به راحتی با استفاده از دستور pip قابل نصب است:
pip install pdf2image
بزرگترین چالشی که در هنگام استخراج متن از فایل PDF با آن روبرو هستیم، این است که فایلهای PDF در فرمتهای مختلفی وجود دارند. بنابراین، ابتدا باید تابعی را آماده کنیم تا بتوانیم هر فرمتی از یک فایل PDF را به فرمت مورد نظر خود تبدیل کنیم.
استخراج متن از PDF با استفاده از پایتون چگونه است؟
در ابتدای این پروژه از آموزش پروژه محور پایتون، باید تمام پکیجها را وارد کنیم. برای تبدیل فایلهای PDF به فایلهای تصویری ppm به pdf2image نیاز دارید.
همچنین باید مسیرهای پیوستگی (Paths to Join) را دستکاری کنیم و نام فایلهای متنی را تغییر دهیم. برای این کار، پکیجهای os و sys را وارد میکنیم. قسمت زیر یک کتابخانه PIL را فراخوانی میکند و تصویر را با pytesseract وارد میکند:
import pdf2image
import os, sys
try:
from PIL import Image
except ImportError:
import Image
import pytesseract
اکنون باید مسیر اسناد (Path of Documents) شما و شمارنده (Counter) را مقداردهی کنیم تا بعداً در تابع pdf extract برای شمارش اسناد شما در پوشه استفاده شود:
PATH = 'Enter your path'
#initialize the counter that you will use later in your pdf extraction function
i = 1
اکنون ما باید برخی از فایلهای غیر ضروری را از فایلهای pdf خود حذف کنیم. برای این کار، من یک تابع جدید ایجاد میکنم:
def delete_ppms():
for file in os.listdir(PATH):
if '.ppm' in file or '.DS_Store' in file:
try:
os.remove(PATH + file)
except FileNotFoundError:
pass
حال باید فایلهای pfd را بر اساس نوع آنها مرتب کنیم. من این کار را با ایجاد دو لیست برای فایلهای pdf و فایلهای docx شروع میکنم؛ زیرا این دو فرمت از پرکاربردترین انواع فرمتها در فایلهای متنی هستند:
pdf_files = []
docx_files = []
# append document names into the lists by their extension type
for f in os.listdir(PATH):
full_name = os.path.join(PATH, f)
if os.path.isfile(full_name):
name = os.path.basename(f)
filename, ext = os.path.splitext(name)
if ext == '.pdf':
pdf_files.append(name)
elif ext == ('.docx'):
docx_files.append(name)
اکنون میتوانیم به طور نهایی متن را از فایلهای PDF استخراج کنیم. در اینجا تابع pdf_extract در ابتدا نام هر فایلی که متن از آن استخراج میشود را چاپ میکند. بسته به اندازه سند، استخراج آن ممکن است کمی طول بکشد.
این تابع print به شما کمک میکند تا ببینید کدام فایل در حال حاضر بررسی شده است:
def pdf_extract(file, i):
print("extracting from file:", file)
delete_ppms()
images = pdf2image.convert_from_path(PATH + file, output_folder=PATH)
j = 0
for file in sorted (os.listdir(PATH)):
if '.ppm' in file and 'image' not in file:
os.rename(PATH + file, PATH + 'image' + str(i) + '-' + str(j) + '.ppm')
j += 1
j = 0
f = open(PATH +'result{}.txt'.format(i), 'w')
files = [f for f in os.listdir(PATH) if '.ppm' in f]
for file in sorted(files, key=lambda x: int(x[x.index('-') + 1: x.index('.')])):
temp = pytesseract.image_to_string(Image.open(PATH + file))
f.write(temp)
f.close()
اکنون میتوانیم از تابع خود برای استخراج از تمام فایلهای pdf در این آموزش پروژه محور پایتون استفاده کنیم:
for i in range(len(pdf_files)):
pdf_file = pdf_files[i]
pdf_extract(pdf_file, i)
اکنون پس از اجرای تابع، اگر به دایرکتوری بروید، یک فایل متنی به نام result1.txt با تمام متن استخراج شده از فایل PDF مشاهده خواهید کرد. اگر سؤالی درباره این پروژه داشتید، آن را در کامنتها مطرح کنید.
آموزش پروژه محور پایتون: بازی ورق
در این بخش از آموزش پروژه محور پایتون، نحوه ساخت یک بازی ورق با این زبان برنامه نویسی را به شما آموزش میدهم. در این بازی، هر بازیکن یک کارت از روی زمین بر میدارد و بازیکنی که بالاترین کارت را داشته باشد، برنده آن دست میشود. من قصد داریم این بازی ورق را با تعریف class هایی بسازم که به ترتیب نشان دهنده یک کارت، مجموعه کارتهای روی زمین، یک بازیکن و در نهایت خود بازی هستند.
Class Card
در اینجا یک class وجود دارد که کارتهای بازی را مدل میکند:
class Card:
suits = ["spades",
"hearts",
"diamonds",
"clubs"]
values = [None, None,"2", "3",
"4", "5", "6", "7",
"8", "9", "10",
"Jack", "Queen",
"King", "Ace"]
def __init__(self, v, s):
"""suit + value are ints"""
self.value = v
self.suit = s
def __lt__(self, c2):
if self.value < c2.value:
return True
if self.value == c2.value:
if self.suit < c2.suit:
return True
else:
return False
return False
def __gt__(self, c2):
if self.value > c2.value:
return True
if self.value == c2.value:
if self.suit > c2.suit:
return True
else:
return False
return False
def __repr__(self):
v = self.values[self.value] +\
" of " + \
self.suits[self.suit]
return v
اولین class در بازی ورق ما در این آموزش پروژه محور پایتون، یک class کارت است که دارای دو متغیر class ، بخشهای بدنه (suits) و مقادیر (Values) است. Suits یک tuple از string ها است که تمام خالهایی را که یک کارت میتواند باشد نشان میدهند: گشنیز، خشت، پیک و دل (spades, hearts, diamonds, clubs). مقدار (value) یک tuple از string هایی است که مقادیر عددی متفاوتی را که یک کارت میتواند داشته باشد، نشان میدهد: 2 تا 10، سرباز، بیبی، شاه و آس (Jack, Queen, King, Ace).
عناصر دو شاخص (index) اول مقدار (value) مربوط به tuple هستند، بنابراین string های tuple با شاخصی که نشان میدهند، مطابقت دارند. بنابراین string کارت «2» در یک tuple از مقادیر (values)، در index کارت 2 است.
آبجکتهای کارت (Card objects) دارای دو متغیر نمونه هستند: suit و value که هر کدام با یک عدد صحیح نمایش داده میشوند. متغیرهای نمونه با هم نوع Card object را نشان میدهند. به عنوان مثال، با ایجاد یک Card object و ارسال پارامترهای 2 (برای خال) و 1، یک 2 دل ایجاد میکنید.
این کد برای این متدهای جادویی همچنین میتواند نشان دهد که آیا کارتها دارای ارزش یکسانی هستند یا خیر. به عنوان مثال، اگر هر دو کارت دارای ارزش 10 باشند، متدها از value مربوط به ترکیب کارتها، برای بریدن دست و مساوی نشدن استفاده میکنند.
ترکیبها به ترتیب قدرت در ترکیب چندگانه tuple ردهبندی میشوند. با قویترین ترکیب در آخر. بنابراین، قویترین ترکیب به بالاترین شاخص (index) و ضعیفترین ترکیب به پایینترین شاخص اختصاص داده میشود.
Class Deck
در مرحله بعد پروژه بازی ورق در این آموزش پروژه محور پایتون، برای نشان دادن یک دست کارت باید یک class تعریف کنید:
from random import shuffle
class Deck:
def __init__(self):
self.cards = []
for i in range(2, 15):
for j in range(4):
self.cards\
.append(Card(i,
j))
shuffle(self.cards)
def rm_card(self):
if len(self.cards) == 0:
return
return self.cards.pop()
هنگامی که Deck object را مقداردهی اولیه میکنید، دو حلقه (loop) __init__ ، Card object هایی را ایجاد میکنند که نشان دهنده تمام کارتهای یک دست 52 کارتی است و آنها را به لیست کارتها اضافه میکنند. اولین loop از 2 به 15 میرود، به این دلیل که اولین value یک کارت 2 و آخرین value آن 15 (آس) است.
هر بار در اطراف loop داخلی، یک کارت جدید با استفاده از عدد صحیح از loop بیرونی به عنوان مقدار (یعنی 14 برای یک آس) و عدد صحیح از loop داخلی به عنوان خال ایجاد میشود. این فرآیند 52 کارت ایجاد میکند. یک کارت به ازای هر ترکیب از خال و ارزش عددی.
پس از این که متد کارتها را ایجاد کرد، متد shuffle از ماژول shuffle به طور تصادفی موارد موجود در لیست کارتها را مرتب میکند. این تقلیدی از بر زدن یک دست ورق است.
Deck ما متد دیگری به نام rm_card دارد که یک کارت را از لیست کارتها حذف و برمیگرداند. یا اگر خالی باشد، None را برمیگرداند.
Class Player
شما برای نشان دادن هر بازیکن در بازی، به یک class نیاز دارید تا کارتهای آنها و تعداد دستهایی که هر کدام بردهاند را دنبال کنید:
class Player:
def __init__(self, name):
self.wins = 0
self.card = None
self.name = name
Player class دارای سه متغیر نمونه است: wins (بردها) برای پیگیری تعداد دستهایی که بازیکن برده است، card که نشان دهنده کارتی است که بازیکن در حال حاضر در دست دارد و name برای پیگیری هر بازیکن.
Class Game
در نهایت، شما برای نمایش بازی در این آموزش پروژه محور پایتون، به یک class نیاز دارید:
class Game:
def __init__(self):
name1 = input("p1 name ")
name2 = input("p2 name ")
self.deck = Deck()
self.p1 = Player(name1)
self.p2 = Player(name2)
def wins(self, winner):
w = "{} wins this round"
w = w.format(winner)
print(w)
def draw(self, p1n, p1c, p2n, p2c):
d = "{} drew {} {} drew {}"
d = d.format(p1n,
p1c,
p2n,
p2c)
print(d)
def play_game(self):
cards = self.deck.cards
print("beginning War!")
while len(cards) >= 2:
m = "q to quit. Any " + \
"key to play:"
response = input(m)
if response == 'q':
break
p1c = self.deck.rm_card()
p2c = self.deck.rm_card()
p1n = self.p1.name
p2n = self.p2.name
self.draw(p1n,
p1c,
p2n,
p2c)
if p1c > p2c:
self.p1.wins += 1
self.wins(self.p1.name)
else:
self.p2.wins += 1
self.wins(self.p2.name)
win = self.winner(self.p1,
self.p2)
print("War is over.{} wins"
.format(win))
def winner(self, p1, p2):
if p1.wins > p2.wins:
return p1.name
if p1.wins < p2.wins:
return p2.name
return "It was a tie!"
هنگامی که game object را ایجاد میکنید، پایتون متد __init__ را فراخوانی میکند و تابع ورودی نام دو بازیکن بازی را جمعآوری کرده و در متغیرهای name1 و name2 ذخیره میکند.
سپس یک Deck object جدید ایجاد میکنید، آن را در deck متغیر نمونه ذخیره میکنید و با استفاده از name1 و name2 دو Player object ایجاد میکنید. متد play_game از Game class بازی را شروع میکند. یک loop در این متد وجود دارد که تا زمانی که دو یا چند کارت بر روی زمین باقی مانده باشند، و تا زمانی که پاسخ متغیر برابر با q نباشد، بازی را ادامه میدهد.
در هر چرخش loop ، پاسخ متغیر را به ورودی کاربر اختصاص میدهید. بازی تا زمانی ادامه مییابد که کاربر q را تایپ کند یا کمتر از دو کارت روی زمین باقی بماند. هر بار دو کارت در loop کشیده میشود و متد play_game کارت اول را به p1 و کارت دوم را به p2 اختصاص میدهد.
سپس نام هر بازیکن و کارتی را که کشیده است، print میکند و در مرحله بعد، دو کارت را با هم مقایسه میکند تا ببیند کدام یک بزرگتر است. متغیر نمونه برد را به بازیکنی اختصاص میدهد که بالاترین کارت را دارد و پیامی را print میکند که نشان میدهد او برنده شده است. Game class همچنین متدی به نام winning دارد که دو آیتم بازیکن را میگیرد، به تعداد دستهایی که هر کدام برنده شدهاند نگاه میکند و بازیکنی را که بیشترین دست را برده است، به عنوان برنده نهایی بازمیگرداند.
وقتی کارتهای Deck object تمام میشود، متد play_game پیامی war is over را به منظور پایان بازی نشان میدهد، متد winning را فراخوانی میکند (هر دو p1 و p2 را pass میکند)، و پیامی را به عنوان نتیجه نشان میدهد. این پیام حاوی نام بازیکنی است که برنده شده است.
کد کامل
کد کامل بازی ورق در این آموزش پروژه محور پایتون این است:
from random import shuffle
class Card:
suits = ["spades",
"hearts",
"diamonds",
"clubs"]
values = [None, None,"2", "3",
"4", "5", "6", "7",
"8", "9", "10",
"Jack", "Queen",
"King", "Ace"]
def __init__(self, v, s):
"""suit + value are ints"""
self.value = v
self.suit = s
def __lt__(self, c2):
if self.value < c2.value:
return True
if self.value == c2.value:
if self.suit < c2.suit:
return True
else:
return False
return False
def __gt__(self, c2):
if self.value > c2.value:
return True
if self.value == c2.value:
if self.suit > c2.suit:
return True
else:
return False
return False
def __repr__(self):
v = self.values[self.value] +\
" of " + \
self.suits[self.suit]
return v
class Deck:
def __init__(self):
self.cards = []
for i in range(2, 15):
for j in range(4):
self.cards\
.append(Card(i,
j))
shuffle(self.cards)
def rm_card(self):
if len(self.cards) == 0:
return
return self.cards.pop()
class Player:
def __init__(self, name):
self.wins = 0
self.card = None
self.name = name
class Game:
def __init__(self):
name1 = input("p1 name ")
name2 = input("p2 name ")
self.deck = Deck()
self.p1 = Player(name1)
self.p2 = Player(name2)
def wins(self, winner):
w = "{} wins this round"
w = w.format(winner)
print(w)
def draw(self, p1n, p1c, p2n, p2c):
d = "{} drew {} {} drew {}"
d = d.format(p1n,
p1c,
p2n,
p2c)
print(d)
def play_game(self):
cards = self.deck.cards
print("beginning War!")
while len(cards) >= 2:
m = "q to quit. Any " + \
"key to play:"
response = input(m)
if response == 'q':
break
p1c = self.deck.rm_card()
p2c = self.deck.rm_card()
p1n = self.p1.name
p2n = self.p2.name
self.draw(p1n,
p1c,
p2n,
p2c)
if p1c > p2c:
self.p1.wins += 1
self.wins(self.p1.name)
else:
self.p2.wins += 1
self.wins(self.p2.name)
win = self.winner(self.p1,
self.p2)
print("War is over.{} wins"
.format(win))
def winner(self, p1, p2):
if p1.wins > p2.wins:
return p1.name
if p1.wins < p2.wins:
return p2.name
return "It was a tie!"
game = Game()
game.play_game()
امیدوارم این پروژه درباره ساخت بازی ورق با پایتون مورد پسند شما واقع شده باشد. خوشحال میشویم که سؤالات ارزشمند خود را در بخش کامنتها بپرسید.
آموزش پروژه محور پایتون: Web Scraper
در این بخش از آموزش پروژه محور پایتون، من قصد دارم با این زبان برنامه نویسی یک Web Scraper ایجاد کنم که با استخراج تمام تگها از HTML مربوط به Google News ، تمام Story های آن را بیرون بکشد.
Google News از تگها برای ایجاد لینکهایی به وبسایتهای مختلف که سایت را تشکیل میدهند، استفاده میکند. بنابراین علاوه بر برخی دادههای اضافی، تمام URL های مقالاتی را که Google News نمایش میدهد، جمع آوری میکنید. من برای آنالیز مقالات از Google News ، از ماژول BeautifulSoup استفاده خواهم کرد.
Parsing به معنای گرفتن فرمتی مانند HTML و استفاده از یک زبان برنامه نویسی برای ساختار دادن به آن است. به عنوان مثال، برای تبدیل دادهها به یک شیء. اکنون برای شروع کار ساختن یک Web Scraper با پایتون، باید ماژولی به نام BeautifulSoup را نصب کنید. با استفاده از دستور pip به آسانی میتوان آن را نصب کرد:
pip install beautifulsoup4
ساخت Web Scraper با پایتون چگونه است؟
پایتون برای کار با URL ها، یک ماژول داخلی به نام urllib دارد. کد زیر را به فایل پایتون جدید اضافه کنید:
import urllib.request
from bs4 import BeautifulSoup
class Scraper:
def __init__(self, site):
self.site = site
متد __init__ از یک وب سایت برای استخراج به عنوان یک پارامتر استفاده میکند. بعدتر باید https://news.google.com/ را به عنوان پارامتر ارسال کنید. کلاس Scraper متدی به نام scrape دارد که هر زمان بخواهید دادههای سایتی را که ارسال کردید بازیابی کنید، آن را فراخوانی میکنید.
کد زیر را به متد scrape خود اضافه کنید:
def scrape(self):
r = urllib.request.urlopen(self.site)
html = r.read()
تابع urlopen() در این آموزش پروژه محور پایتون، درخواستی را به یک وب سایت ارسال میکند و یک Response object را که کد HTML در آن ذخیره شده استف همراه با دادههای اضافی برمیگرداند. پاسخ تابع read() ، HTML مربوط به Response object را برمیگرداند. تمام HTML برای وب سایت در متغیر html قرار دارد.
اکنون شما آماده آنالیز HTML هستید. یک خط کد جدید در تابع scrape اضافه کنید که یک BeautifulSoup object ایجاد کند و متغیر html و رشته “html.parser” را به عنوان پارامتر ارسال کنید:
def scrape(self):
r = urllib.request.urlopen(self.site)
html = r.read()
parser = "html.parser"
sp = BeautifulSoup(html,parser)
BeautifulSoup object تمام کارهای سخت را انجام داده و HTML مربوطه را تجزیه (Parsing) میکند. اکنون میتوانید کدی را به تابع scrape اضافه کنید که متد find_all را در BeautifulSoup object فراخوانی میکند.
“a” را به عنوان پارامتر ارسال کنید و این متد تمام URL های وب سایت لینکشده در HTML code خاصی که شما دانلود کردهاید را برمیگرداند:
def scrape(self):
r = urllib.request.urlopen(self.site)
html = r.read()
parser = "html.parser"
sp = BeautifulSoup(html,parser)
for tag in sp.find_all("a"):
url = tag.get("href")
if url is None:
continue
if "articles" in url:
print("\n" + url)
متد find_all ، یک iterable حاوی tag object های یافت شده را برمیگرداند. هر بار در اطراف حلقه for ، متغیر مقدار یک tag object جدید را دریافت میکند. هر tag object دارای متغیرهای نمونه مختلفی است، اما شما فقط مقدار متغیر نمونه href را میخواهید که شامل هر URL است.
شما میتوانید با فراخوانی متد get و ارسال “href” به عنوان یک پارامتر، آن را دریافت کنید. در نهایت، شما تأیید میکنید که متغیر URL حاوی داده است. این شامل رشته “articles” است (شما نمیخواهید لینکهای داخلی را print کنید)؛ و اگر چنین است، آن را print کنید. این یک Web Scraper کامل است:
import urllib.request
from bs4 import BeautifulSoup
class Scraper:
def __init__(self, site):
self.site = site
def scrape(self):
r = urllib.request.urlopen(self.site)
html = r.read()
parser = "html.parser"
sp = BeautifulSoup(html,parser)
for tag in sp.find_all("a"):
url = tag.get("href")
if url is None:
continue
if "articles" in url:
print("\n" + url)
news = "https://news.google.com/"
Scraper(news).scrape()
هنگامی که برنامه خود را اجرا میکنید، خروجی باید به شکل زیر باشد:
./articles/CBMiiQFodHRwczovL3d3dy5tb25leWNvbnRyb2wuY29tL25ld3MvYnVzaW5lc3MvaXBvL2J1bXBlci1saXN0aW5nLWNoZW1jb24tc3BlY2lhbGl0eS1jaGVtaWNhbHMtZGVidXRzLWF0LXJzLTczMC05NS1hLTExNS1wcmVtaXVtLTU5MDc2MjEuaHRtbNIBjQFodHRwczovL3d3dy5tb25leWNvbnRyb2wuY29tL25ld3MvYnVzaW5lc3MvaXBvL2J1bXBlci1saXN0aW5nLWNoZW1jb24tc3BlY2lhbGl0eS1jaGVtaWNhbHMtZGVidXRzLWF0LXJzLTczMC05NS1hLTExNS1wcmVtaXVtLTU5MDc2MjEuaHRtbC9hbXA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiiQFodHRwczovL3d3dy5tb25leWNvbnRyb2wuY29tL25ld3MvYnVzaW5lc3MvaXBvL2J1bXBlci1saXN0aW5nLWNoZW1jb24tc3BlY2lhbGl0eS1jaGVtaWNhbHMtZGVidXRzLWF0LXJzLTczMC05NS1hLTExNS1wcmVtaXVtLTU5MDc2MjEuaHRtbNIBjQFodHRwczovL3d3dy5tb25leWNvbnRyb2wuY29tL25ld3MvYnVzaW5lc3MvaXBvL2J1bXBlci1saXN0aW5nLWNoZW1jb24tc3BlY2lhbGl0eS1jaGVtaWNhbHMtZGVidXRzLWF0LXJzLTczMC05NS1hLTExNS1wcmVtaXVtLTU5MDc2MjEuaHRtbC9hbXA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiiQFodHRwczovL3d3dy5tb25leWNvbnRyb2wuY29tL25ld3MvYnVzaW5lc3MvaXBvL2J1bXBlci1saXN0aW5nLWNoZW1jb24tc3BlY2lhbGl0eS1jaGVtaWNhbHMtZGVidXRzLWF0LXJzLTczMC05NS1hLTExNS1wcmVtaXVtLTU5MDc2MjEuaHRtbNIBjQFodHRwczovL3d3dy5tb25leWNvbnRyb2wuY29tL25ld3MvYnVzaW5lc3MvaXBvL2J1bXBlci1saXN0aW5nLWNoZW1jb24tc3BlY2lhbGl0eS1jaGVtaWNhbHMtZGVidXRzLWF0LXJzLTczMC05NS1hLTExNS1wcmVtaXVtLTU5MDc2MjEuaHRtbC9hbXA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEN65JBQTlrAk1479WuKaQrAqFwgEKg4IACoGCAowxLQ_MNevCDDnvNMF?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEN65JBQTlrAk1479WuKaQrAqFwgEKg4IACoGCAowxLQ_MNevCDDnvNMF?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEIfG6g8TDa91LrUgvv4SfRcqGQgEKhAIACoHCAow2pqGCzD954MDMJzyigY?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEIfG6g8TDa91LrUgvv4SfRcqGQgEKhAIACoHCAow2pqGCzD954MDMJzyigY?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEG22Qtp4ab78Y5kFLRsWq-wqGQgEKhAIACoHCAow55veCjDzvdUBMIPh5gU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEG22Qtp4ab78Y5kFLRsWq-wqGQgEKhAIACoHCAow55veCjDzvdUBMIPh5gU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEEQDNi_6fessB82J6KVeq60qFggEKg4IACoGCAowxLQ_MNevCDCkoh8?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEEQDNi_6fessB82J6KVeq60qFggEKg4IACoGCAowxLQ_MNevCDCkoh8?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEKuQtxbx8j-uunfY5g-gOtoqFggEKg4IACoGCAoww7k_MMevCDDpywE?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEKuQtxbx8j-uunfY5g-gOtoqFggEKg4IACoGCAoww7k_MMevCDDpywE?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEKuQtxbx8j-uunfY5g-gOtoqFggEKg4IACoGCAoww7k_MMevCDDpywE?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CCAiC0o4TkNDS2JxVUhjmAEB?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CCAiC0o4TkNDS2JxVUhjmAEB?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEEGQxdSeKlwa2YvVLQyLUb8qFwgEKg4IACoGCAoww7k_MMevCDC6rdgG?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEEGQxdSeKlwa2YvVLQyLUb8qFwgEKg4IACoGCAoww7k_MMevCDC6rdgG?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEJM9pEXAVv1HEP1h6QlDxTIqGAgEKg8IACoHCAow3rvTBDD89X4w0bTmBQ?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEJM9pEXAVv1HEP1h6QlDxTIqGAgEKg8IACoHCAow3rvTBDD89X4w0bTmBQ?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEKG6ZOcOPT_OJQ6OLwGKe7sqGQgEKhAIACoHCAowzrL9CjDC7vQCMK2y1gU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEKG6ZOcOPT_OJQ6OLwGKe7sqGQgEKhAIACoHCAowzrL9CjDC7vQCMK2y1gU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEKG6ZOcOPT_OJQ6OLwGKe7sqGQgEKhAIACoHCAowzrL9CjDC7vQCMK2y1gU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEB_BeoliNbGwiNgLG9wZvAcqGQgEKhAIACoHCAowj8n_CjDIrfkCMJWZ2AY?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEB_BeoliNbGwiNgLG9wZvAcqGQgEKhAIACoHCAowj8n_CjDIrfkCMJWZ2AY?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMia2h0dHBzOi8vdGltZXNvZmluZGlhLmluZGlhdGltZXMuY29tL2NpdHkvaHlkZXJhYmFkL3dhcy1tb3NxdWUtZGVtb2xpc2hlZC1tYWdpY2FsbHkvYXJ0aWNsZXNob3cvNzg0MTU3OTAuY21z0gFmaHR0cHM6Ly9tLnRpbWVzb2ZpbmRpYS5jb20vY2l0eS9oeWRlcmFiYWQvd2FzLW1vc3F1ZS1kZW1vbGlzaGVkLW1hZ2ljYWxseS9hbXBfYXJ0aWNsZXNob3cvNzg0MTU3OTAuY21z?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMia2h0dHBzOi8vdGltZXNvZmluZGlhLmluZGlhdGltZXMuY29tL2NpdHkvaHlkZXJhYmFkL3dhcy1tb3NxdWUtZGVtb2xpc2hlZC1tYWdpY2FsbHkvYXJ0aWNsZXNob3cvNzg0MTU3OTAuY21z0gFmaHR0cHM6Ly9tLnRpbWVzb2ZpbmRpYS5jb20vY2l0eS9oeWRlcmFiYWQvd2FzLW1vc3F1ZS1kZW1vbGlzaGVkLW1hZ2ljYWxseS9hbXBfYXJ0aWNsZXNob3cvNzg0MTU3OTAuY21z?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiigFodHRwczovL3RpbWVzb2ZpbmRpYS5pbmRpYXRpbWVzLmNvbS9jaXR5L2x1Y2tub3cvY291cnRyb29tLXRlbnNlLWFzLWp1ZGdlLXNwb2tlLWphaS1zcmktcmFtLWNyaWVzLWFmdGVyLWFjcXVpdHRhbC9hcnRpY2xlc2hvdy83ODQxNjU0NC5jbXPSAYUBaHR0cHM6Ly9tLnRpbWVzb2ZpbmRpYS5jb20vY2l0eS9sdWNrbm93L2NvdXJ0cm9vbS10ZW5zZS1hcy1qdWRnZS1zcG9rZS1qYWktc3JpLXJhbS1jcmllcy1hZnRlci1hY3F1aXR0YWwvYW1wX2FydGljbGVzaG93Lzc4NDE2NTQ0LmNtcw?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiigFodHRwczovL3RpbWVzb2ZpbmRpYS5pbmRpYXRpbWVzLmNvbS9jaXR5L2x1Y2tub3cvY291cnRyb29tLXRlbnNlLWFzLWp1ZGdlLXNwb2tlLWphaS1zcmktcmFtLWNyaWVzLWFmdGVyLWFjcXVpdHRhbC9hcnRpY2xlc2hvdy83ODQxNjU0NC5jbXPSAYUBaHR0cHM6Ly9tLnRpbWVzb2ZpbmRpYS5jb20vY2l0eS9sdWNrbm93L2NvdXJ0cm9vbS10ZW5zZS1hcy1qdWRnZS1zcG9rZS1qYWktc3JpLXJhbS1jcmllcy1hZnRlci1hY3F1aXR0YWwvYW1wX2FydGljbGVzaG93Lzc4NDE2NTQ0LmNtcw?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEHNTCoiBrzsZh27XzSLO4BgqGAgEKg8IACoHCAow3rvTBDD89X4w8YzmBQ?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEHNTCoiBrzsZh27XzSLO4BgqGAgEKg8IACoHCAow3rvTBDD89X4w8YzmBQ?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMikgFodHRwczovL3d3dy5uZXdzMTguY29tL25ld3MvYnV6ei9qb2UtYmlkZW4tc2FpZC1pbnNoYWxsYWgtdG8tdHJvbGwtZG9uYWxkLXRydW1wLWR1cmluZy1wcmVzaWRlbnRpYWwtZGViYXRlLXR3aXR0ZXItc2F5cy1pdHMtcGVhay0yMDIwLTI5MjI3MDUuaHRtbNIBlgFodHRwczovL3d3dy5uZXdzMTguY29tL2FtcC9uZXdzL2J1enovam9lLWJpZGVuLXNhaWQtaW5zaGFsbGFoLXRvLXRyb2xsLWRvbmFsZC10cnVtcC1kdXJpbmctcHJlc2lkZW50aWFsLWRlYmF0ZS10d2l0dGVyLXNheXMtaXRzLXBlYWstMjAyMC0yOTIyNzA1Lmh0bWw?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMikgFodHRwczovL3d3dy5uZXdzMTguY29tL25ld3MvYnV6ei9qb2UtYmlkZW4tc2FpZC1pbnNoYWxsYWgtdG8tdHJvbGwtZG9uYWxkLXRydW1wLWR1cmluZy1wcmVzaWRlbnRpYWwtZGViYXRlLXR3aXR0ZXItc2F5cy1pdHMtcGVhay0yMDIwLTI5MjI3MDUuaHRtbNIBlgFodHRwczovL3d3dy5uZXdzMTguY29tL2FtcC9uZXdzL2J1enovam9lLWJpZGVuLXNhaWQtaW5zaGFsbGFoLXRvLXRyb2xsLWRvbmFsZC10cnVtcC1kdXJpbmctcHJlc2lkZW50aWFsLWRlYmF0ZS10d2l0dGVyLXNheXMtaXRzLXBlYWstMjAyMC0yOTIyNzA1Lmh0bWw?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMikgFodHRwczovL3d3dy5uZXdzMTguY29tL25ld3MvYnV6ei9qb2UtYmlkZW4tc2FpZC1pbnNoYWxsYWgtdG8tdHJvbGwtZG9uYWxkLXRydW1wLWR1cmluZy1wcmVzaWRlbnRpYWwtZGViYXRlLXR3aXR0ZXItc2F5cy1pdHMtcGVhay0yMDIwLTI5MjI3MDUuaHRtbNIBlgFodHRwczovL3d3dy5uZXdzMTguY29tL2FtcC9uZXdzL2J1enovam9lLWJpZGVuLXNhaWQtaW5zaGFsbGFoLXRvLXRyb2xsLWRvbmFsZC10cnVtcC1kdXJpbmctcHJlc2lkZW50aWFsLWRlYmF0ZS10d2l0dGVyLXNheXMtaXRzLXBlYWstMjAyMC0yOTIyNzA1Lmh0bWw?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiMmh0dHBzOi8vd3d3LmJiYy5jb20vbmV3cy9lbGVjdGlvbi11cy0yMDIwLTU0MzU5OTkz0gE2aHR0cHM6Ly93d3cuYmJjLmNvbS9uZXdzL2FtcC9lbGVjdGlvbi11cy0yMDIwLTU0MzU5OTkz?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiMmh0dHBzOi8vd3d3LmJiYy5jb20vbmV3cy9lbGVjdGlvbi11cy0yMDIwLTU0MzU5OTkz0gE2aHR0cHM6Ly93d3cuYmJjLmNvbS9uZXdzL2FtcC9lbGVjdGlvbi11cy0yMDIwLTU0MzU5OTkz?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEN6aa394GsWZUcUGXrA5c1MqFggEKg4IACoGCAowl6p7MN-zCTCOvRU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEN6aa394GsWZUcUGXrA5c1MqFggEKg4IACoGCAowl6p7MN-zCTCOvRU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEN0KfjKEcFiAFIUFjmbZyVsqFAgEKgwIACoFCAowhgIwkDgwob0I?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEN0KfjKEcFiAFIUFjmbZyVsqFAgEKgwIACoFCAowhgIwkDgwob0I?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEB13zqCd52y2AMSVeJKeC0cqFggEKg4IACoGCAowl6p7MN-zCTC9vBU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEB13zqCd52y2AMSVeJKeC0cqFggEKg4IACoGCAowl6p7MN-zCTC9vBU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEMU5tjLhEKVlJN7lbLB1posqFwgEKg4IACoGCAowxLQ_MNevCDDnvNMF?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEMU5tjLhEKVlJN7lbLB1posqFwgEKg4IACoGCAowxLQ_MNevCDDnvNMF?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMisAFodHRwczovL3d3dy5uZXdzMTguY29tL25ld3MvaW5kaWEvY29yb25hdmlydXMtbGl2ZS11cGRhdGVzLW1vZGVybmFzLWNvdmlkLTE5LXNob3Qtd29udC1iZS1yZWFkeS1ieS11cy1lbGVjdGlvbnMtZmRhLXdpZGVucy1zYWZldHktaW5xdWlyeS1pbnRvLWFzdHJhemVuZWNhcy12YWNjaW5lLTI5MjM2MjkuaHRtbNIBtAFodHRwczovL3d3dy5uZXdzMTguY29tL2FtcC9uZXdzL2luZGlhL2Nvcm9uYXZpcnVzLWxpdmUtdXBkYXRlcy1tb2Rlcm5hcy1jb3ZpZC0xOS1zaG90LXdvbnQtYmUtcmVhZHktYnktdXMtZWxlY3Rpb25zLWZkYS13aWRlbnMtc2FmZXR5LWlucXVpcnktaW50by1hc3RyYXplbmVjYXMtdmFjY2luZS0yOTIzNjI5Lmh0bWw?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMisAFodHRwczovL3d3dy5uZXdzMTguY29tL25ld3MvaW5kaWEvY29yb25hdmlydXMtbGl2ZS11cGRhdGVzLW1vZGVybmFzLWNvdmlkLTE5LXNob3Qtd29udC1iZS1yZWFkeS1ieS11cy1lbGVjdGlvbnMtZmRhLXdpZGVucy1zYWZldHktaW5xdWlyeS1pbnRvLWFzdHJhemVuZWNhcy12YWNjaW5lLTI5MjM2MjkuaHRtbNIBtAFodHRwczovL3d3dy5uZXdzMTguY29tL2FtcC9uZXdzL2luZGlhL2Nvcm9uYXZpcnVzLWxpdmUtdXBkYXRlcy1tb2Rlcm5hcy1jb3ZpZC0xOS1zaG90LXdvbnQtYmUtcmVhZHktYnktdXMtZWxlY3Rpb25zLWZkYS13aWRlbnMtc2FmZXR5LWlucXVpcnktaW50by1hc3RyYXplbmVjYXMtdmFjY2luZS0yOTIzNjI5Lmh0bWw?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEHcEaDHAGN-USkGrC2ffI7sqGQgEKhAIACoHCAowj8n_CjDIrfkCMNCf6AU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEHcEaDHAGN-USkGrC2ffI7sqGQgEKhAIACoHCAowj8n_CjDIrfkCMNCf6AU?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiggFodHRwczovL2luZGlhbmV4cHJlc3MuY29tL2FydGljbGUvY29yb25hdmlydXMvbW9kZXJuYS1jb3ZpZC0xOS12YWNjaW5lLXdlbGwtdG9sZXJhdGVkLWdlbmVyYXRlcy1pbW11bmUtb2xkZXItYWR1bHRzLXN0dWR5LTY2NDg0NjUv0gGHAWh0dHBzOi8vaW5kaWFuZXhwcmVzcy5jb20vYXJ0aWNsZS9jb3JvbmF2aXJ1cy9tb2Rlcm5hLWNvdmlkLTE5LXZhY2NpbmUtd2VsbC10b2xlcmF0ZWQtZ2VuZXJhdGVzLWltbXVuZS1vbGRlci1hZHVsdHMtc3R1ZHktNjY0ODQ2NS9saXRlLw?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiggFodHRwczovL2luZGlhbmV4cHJlc3MuY29tL2FydGljbGUvY29yb25hdmlydXMvbW9kZXJuYS1jb3ZpZC0xOS12YWNjaW5lLXdlbGwtdG9sZXJhdGVkLWdlbmVyYXRlcy1pbW11bmUtb2xkZXItYWR1bHRzLXN0dWR5LTY2NDg0NjUv0gGHAWh0dHBzOi8vaW5kaWFuZXhwcmVzcy5jb20vYXJ0aWNsZS9jb3JvbmF2aXJ1cy9tb2Rlcm5hLWNvdmlkLTE5LXZhY2NpbmUtd2VsbC10b2xlcmF0ZWQtZ2VuZXJhdGVzLWltbXVuZS1vbGRlci1hZHVsdHMtc3R1ZHktNjY0ODQ2NS9saXRlLw?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEDfa74FROlvLHzyPIVDbXFYqFwgEKg4IACoGCAowxLQ_MNevCDDnvNMF?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEDfa74FROlvLHzyPIVDbXFYqFwgEKg4IACoGCAowxLQ_MNevCDDnvNMF?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEDetFhO9fBaleLttbd22zb4qFggEKg4IACoGCAoww7k_MMevCDDpywE?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEDetFhO9fBaleLttbd22zb4qFggEKg4IACoGCAoww7k_MMevCDDpywE?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEDetFhO9fBaleLttbd22zb4qFggEKg4IACoGCAoww7k_MMevCDDpywE?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEHgy-jTL75PvW0YSpz73cJMqGQgEKhAIACoHCAowzrL9CjDC7vQCMM6a0wY?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEHgy-jTL75PvW0YSpz73cJMqGQgEKhAIACoHCAowzrL9CjDC7vQCMM6a0wY?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEDH5jNSiFxuFpjIB29xGfY0qGAgEKg8IACoHCAow3rvTBDD89X4w8YzmBQ?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEDH5jNSiFxuFpjIB29xGfY0qGAgEKg8IACoHCAow3rvTBDD89X4w8YzmBQ?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEPGK1AAXrmZY6jsLb1sTa_MqGQgEKhAIACoHCAowj8n_CjDIrfkCMILSxQY?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CAIiEPGK1AAXrmZY6jsLb1sTa_MqGQgEKhAIACoHCAowj8n_CjDIrfkCMILSxQY?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiigFodHRwczovL2xpdmV1cGRhdGVzLmhpbmR1c3RhbnRpbWVzLmNvbS9pbmRpYS9jb3JvbmF2aXJ1cy1pbmRpYS13b3JsZC1sYXRlc3QtbmV3cy1jb3ZpZC0xOS1kZWF0aC10b2xsLXNlcHRlbWJlci0zMC0yMDIwLTIxNjAxNDI5OTE0MTM5Lmh0bWzSAY4BaHR0cHM6Ly9saXZldXBkYXRlcy5oaW5kdXN0YW50aW1lcy5jb20vaW5kaWEvY29yb25hdmlydXMtaW5kaWEtd29ybGQtbGF0ZXN0LW5ld3MtY292aWQtMTktZGVhdGgtdG9sbC1zZXB0ZW1iZXItMzAtMjAyMC0yMTYwMTQyOTkxNDEzOV9hbXAuaHRtbA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiigFodHRwczovL2xpdmV1cGRhdGVzLmhpbmR1c3RhbnRpbWVzLmNvbS9pbmRpYS9jb3JvbmF2aXJ1cy1pbmRpYS13b3JsZC1sYXRlc3QtbmV3cy1jb3ZpZC0xOS1kZWF0aC10b2xsLXNlcHRlbWJlci0zMC0yMDIwLTIxNjAxNDI5OTE0MTM5Lmh0bWzSAY4BaHR0cHM6Ly9saXZldXBkYXRlcy5oaW5kdXN0YW50aW1lcy5jb20vaW5kaWEvY29yb25hdmlydXMtaW5kaWEtd29ybGQtbGF0ZXN0LW5ld3MtY292aWQtMTktZGVhdGgtdG9sbC1zZXB0ZW1iZXItMzAtMjAyMC0yMTYwMTQyOTkxNDEzOV9hbXAuaHRtbA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiXGh0dHBzOi8vd3d3LmJvb21saXZlLmluL2Zha2UtbmV3cy9uby10aGlzLWlzLW5vdC1hLXBob3RvLW9mLXRoZS1kZWNlYXNlZC1oYXRocmFzLXZpY3RpbS05OTcw0gEA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiXGh0dHBzOi8vd3d3LmJvb21saXZlLmluL2Zha2UtbmV3cy9uby10aGlzLWlzLW5vdC1hLXBob3RvLW9mLXRoZS1kZWNlYXNlZC1oYXRocmFzLXZpY3RpbS05OTcw0gEA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiaGh0dHBzOi8vdGhlbG9naWNhbGluZGlhbi5jb20vZmFjdC1jaGVjay93b21hbi1hc3NhdWx0ZWQtdG9ydHVyZWQtaGF0aHJhcy11dHRhci1wcmFkZXNoLXZpcmFsLXBob3RvLTI0MDc50gEA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMiaGh0dHBzOi8vdGhlbG9naWNhbGluZGlhbi5jb20vZmFjdC1jaGVjay93b21hbi1hc3NhdWx0ZWQtdG9ydHVyZWQtaGF0aHJhcy11dHRhci1wcmFkZXNoLXZpcmFsLXBob3RvLTI0MDc50gEA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMidWh0dHBzOi8vd3d3LmluZGlhdG9kYXkuaW4vZmFjdC1jaGVjay9zdG9yeS93cm9uZy1naXJsLWdvZXMtdmlyYWwtb24tc29jaWFsLW1lZGlhLWFzLWhhdGhyYXMtdmljdGltLTE3MjY3MjItMjAyMC0wOS0yOdIBAA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMidWh0dHBzOi8vd3d3LmluZGlhdG9kYXkuaW4vZmFjdC1jaGVjay9zdG9yeS93cm9uZy1naXJsLWdvZXMtdmlyYWwtb24tc29jaWFsLW1lZGlhLWFzLWhhdGhyYXMtdmljdGltLTE3MjY3MjItMjAyMC0wOS0yOdIBAA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMibGh0dHBzOi8vd3d3LmFsdG5ld3MuaW4vdmlkZW8tc2hhcmVkLXRvLW1ha2UtbWlzbGVhZGluZy1jbGFpbS10aGF0LWhhdGhyYXMtdmljdGltcy1mYW1pbHktZGlkLWhlci1sYXN0LXJpdGVzL9IBAA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMibGh0dHBzOi8vd3d3LmFsdG5ld3MuaW4vdmlkZW8tc2hhcmVkLXRvLW1ha2UtbWlzbGVhZGluZy1jbGFpbS10aGF0LWhhdGhyYXMtdmljdGltcy1mYW1pbHktZGlkLWhlci1sYXN0LXJpdGVzL9IBAA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMibmh0dHBzOi8vZmFjdGx5LmluL29zZC10by1mb3JtZXItbWFoYXJhc2h0cmEtY20tZGV2ZW5kcmEtZmFkbmF2aXMtaXMtYmVpbmctcmVmZXJyZWQtYXMtb3NkLXRvLXVkZGhhdi10aGFja2VyYXkv0gEA?hl=en-IN&gl=IN&ceid=IN%3Aen
./articles/CBMibmh0dHBzOi8vZmFjdGx5LmluL29zZC10by1mb3JtZXItbWFoYXJhc2h0cmEtY20tZGV2ZW5kcmEtZmFkbmF2aXMtaXMtYmVpbmctcmVmZXJyZWQtYXMtb3NkLXRvLXVkZGhhdi10aGFja2VyYXkv0gEA?hl=en-IN&gl=IN&ceid=IN%3Aen
Process finished with exit code 0
اکنون با این Web Scraper که در آموزش پروژه محور پایتون یاد گرفتید، میتوانید سرفصلهای Google News را جمعآوری کنید. این شامل امکاناتی بیپایان است. شما میتوانید برنامهای بنویسید که کلمات پرکاربرد را در تیترها آنالیز کند. شما میتوانید برنامهای برای تجزیه و تحلیل احساسات بازار سهام ایجاد کنید و فرصتهای معاملاتی را از این طریق کشف کنید.
در نهایت، میتوان گفت که با داشتن یک Web Scraper ، دنیا برای شماست و امیدوارم که برای شما هم به اندازه من مفید باشد.
آموزش پروژه محور پایتون: ساخت طراحی با مداد به وسیله پایتون
قبل از نوشتن هر کدی برای این برنامه، اجازه دهید مراحل این کار را مرور کنیم و سعی کنیم کمی آنها را درک نماییم. ایتدا تصویری را که میخواهید با پایتون به طرح مدادی تبدیل کنید، بیابید. همانطور که میبینید، من برای این کار از تصویر یک توله سگ استفاده خواهم کرد.

در مرحله بعد، باید تصویر را با فرمت RBG بخوانیم و سپس آن را به یک grayscale image تبدیل کنیم. با این کار، تصویر به یک عکس سیاه و سفید کلاسیک تبدیل میشود.
سپس باید grayscale image را که negative image هم نامیده میشود، معکوس کنید. این تصویر همان grayscale image ماست که invert شده است. از inversion میتوان برای افزایش جزئیات استفاده کرد.
در آخر، میتوانیم با ترکیب کردن grayscale image و inverted image تار، یک طرح مدادی ایجاد کنیم. این کار را میتوان با divide کردن grayscale image بر inverted image تارشده انجام داد. از آنجایی که تصاویر فقط آرایه هستند، به راحتی میتوانیم این کار را با استفاده از تابع divide از کتابخانه cv2 در پایتون انجام دهیم.
بیایید کدنویسی کنیم
به تنها کتابخانهای که برای آموزش پروژه محور پایتون: تبدیل تصویر به طرح مدادی نیاز داریم، کتابخانه OpenCV در پایتون است. با استفاده از دستور pip میتوان از آن استفاده کرد.
pip install opencv-python
import cv2
من تصویر را در هر مرحله نمایش نمیدهم. اگر میخواهید تصویر را در هر مرحله نمایش دهید تا تغییرات را در آن مشاهده کنید، باید از دو دستور استفاده کنید. cv2.imshow(“Title You want to give”, Image) و سپس به سادگی cv2.waitKey(0) را بنویسید. با این کار، تصویر نمایش داده میشود.
حالا کار بعدی که باید انجام دهید این است که تصویر را بخوانید:
image = cv2.imread("dog.jpg")
cv2.imshow("Dog", image)
cv2.waitKey(0)
اکنون پس از خواندن تصویر، با تبدیل تصویر اصلی به grayscale image ، یک تصویر جدید ایجاد میکنیم:
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2.imshow("New Dog", gray_image)
cv2.waitKey(0)
مرحله بعدی invert کردن تصویر جدید در مقیاس grayscale image است:
inverted_image = 255 - gray_image
cv2.imshow("Inverted", inverted_image)
cv2.waitKey()
مرحله بعدی در این فرآیند، محو کردن تصویر با استفاده از تابع Gaussian در OpenCV است:
blurred = cv2.GaussianBlur(inverted_image, (21, 21), 0)
مرحله نهایی این آموزش پروژه محور پایتون این است که تصویر تار شده را invert کنیم. سپس میتوانیم به راحتی تصویر را به طرح مدادی تبدیل کنیم:
inverted_blurred = 255 - blurred
pencil_sketch = cv2.divide(gray_image, inverted_blurred, scale=256.0)
cv2.imshow("Sketch", pencil_sketch)
cv2.waitKey(0)

و در نهایت، اگر میخواهید هم به تصویر اصلی و هم به طرح مدادی نگاهی بیندازید، میتوانید از دستورات زیر استفاده کنید:
cv2.imshow("original image", image)
cv2.imshow("pencil sketch", pencil_sketch)
cv2.waitKey(0)

بنابراین به این صورت است که میتوانیم یک تصویر را با پایتون به طرح مدادی تبدیل کنیم. امیدوارم این مقاله در مورد نحوه تبدیل تصویر به طرح مدادی با پایتون مورد پسند شما قرار گرفته باشد.
بنابراین به این صورت، میتوانیم یک تصویر را با پایتون به طرح مدادی تبدیل کنیم. امیدوارم این بخش از آموزش پروژه محور پایتون به کار شما آمده باشد.
آموزش پروژه محور پایتون: رابط کاربری گرافیکی متن با پایتون
در این بخش از آموزش پروژه محور پایتون، نحوه ایجاد رابط کاربری گرافیکی (GUI) ویرایشگر متن را به شما توضیح خواهم داد. این ویرایشگر متن میتواند فایلهای متنی را ایجاد، ویرایش و ذخیره کند. برای ایجاد این GUI به سه ویجت مهم نیاز داریم. 2 ویجت دکمه برای ذخیره کردن و بستن، و ویجت text box برای ایجاد و ویرایش فایلهای متنی.
GUI ویرایشگر متن چگونه با پایتون کدنویسی میشود؟
تمام ویجتها باید به گونهای مرتب شوند که ویجتهای دکمهها در سمت چپ layout پنجره و ویجت text box در سمت راست آن قرار بگیرند.
ارتفاع کل پنجره باید حداقل 800 پیکسل باشد و ویجت جعبه متن باید حداقل 800 پیکسل عرض داشته باشد. کل layout باید responsive باشد تا اگر اندازه پنجره تغییر کرد، اندازه ویجت text box نیز تغییر کند.
تصویر زیر نشان میدهد که یک ویرایشگر متن پایه، چگونه به نظر میرسد. اما به جای اضافه کردن دکمههای save as و open در بالا، آنها را در سمت چپ ویرایشگر متن اضافه میکنیم:

من برای ساختن رابط کاربری گرافیکی ویرایشگر متن، از پکیج Tkinter در پایتون استفاده خواهم کرد. اکنون که ایده این کار را داریم، بیایید کدنویسی را شروع کنیم.
من این پروژه از آموزش های پروژه محور پایتون را با وارد کردن پکیج Tkinter و با تعریف متغیرهای ویجتهایی که در بالا صحبتشان را کردیم، آغاز میکنم. اگر برای اولین بار از پکیج Tkinter استفاده میکنید، نیازی به نصب آن با دستور pip ندارید. زیرا این پکیج از قبل در محیط مجازی پایتون نصب شده است. حالا بیایید کدنویسی را شروع کنیم:
import tkinter as tk
window = tk.Tk()
window.title("Thecleverprogrammer")
window.rowconfigure(0, minsize=800, weight=1)
window.columnconfigure(1, minsize=800, weight=1)
txt_edit = tk.Text(window)
fr_buttons = tk.Frame(window)
btn_open = tk.Button(fr_buttons, text='Open')
btn_save = tk.Button(fr_buttons, text="Save As")
حالا بیایید روی layout ویرایشگر متن خود کار کنیم. ابتدا باید دکمهها را به frame اختصاص دهیم:
btn_open.grid(row=0, column=0, sticky="ew", padx=5, pady=5)
btn_save.grid(row=1, column=0, sticky="ew", padx=5)
از آنجایی که دکمهها را به frame ویرایشگر متن خود اختصاص دادهایم، اکنون باید یک grid layout برای پنجره اصلی خود تنظیم کنیم:
fr_buttons.grid(row=0, column=0, sticky="ns")
txt_edit.grid(row=0, column=1, sticky="nsew")
اکنون اگر کد را با استفاده از تابع window.mainloop() اجرا کنید، layout رابط کاربری گرافیکی ویرایشگر متن ما نمایش داده میشود:

اما این فقط یک layout است و در این مرحله هیچ کاری انجام نمیدهد. اکنون باید دو تابع ایجاد کنیم تا بتوانیم با استفاده از این رابط کاربری گرافیکی، متون خود را نوشته، ذخیره و ویرایش کنیم.
تابع Open file
def open_file():
"""Open a file for editing."""
filepath = askopenfilename(
filetypes=[("Text Files", "*.txt"), ("All Files", "*.*")]
)
if not filepath:
return
txt_edit.delete("1.0", tk.END)
with open(filepath, "r") as input_file:
text = input_file.read()
txt_edit.insert(tk.END, text)
window.title(f"Thecleverprogrammer - {filepath}")
تابع Save file
def save_file():
"""Save the current file as a new file."""
filepath = asksaveasfilename(
defaultextension="txt",
filetypes=[("Text Files", "*.txt"), ("All Files", "*.*")],
)
if not filepath:
return
with open(filepath, "w") as output_file:
text = txt_edit.get("1.0", tk.END)
output_file.write(text)
window.title(f"Thecleverprogrammer - {filepath}")
تابع بالا به ما کمک میکند تا با رابط کاربری گرافیکی، ویرایشگر متن خودمان را درک کنیم. شما میتوانید این تابع را مطابق با تسکهای مورد نظر خود تغییر دهید. حالا بیایید ببینیم کد کامل ما چگونه خواهد بود:
import tkinter as tk
from tkinter.filedialog import askopenfilename, asksaveasfilename
def open_file():
"""Open a file for editing."""
filepath = askopenfilename(
filetypes=[("Text Files", "*.txt"), ("All Files", "*.*")]
)
if not filepath:
return
txt_edit.delete(1.0, tk.END)
with open(filepath, "r") as input_file:
text = input_file.read()
txt_edit.insert(tk.END, text)
window.title(f"Thecleverprogrammer - {filepath}")
def save_file():
"""Save the current file as a new file."""
filepath = asksaveasfilename(
defaultextension="txt",
filetypes=[("Text Files", "*.txt"), ("All Files", "*.*")],
)
if not filepath:
return
with open(filepath, "w") as output_file:
text = txt_edit.get(1.0, tk.END)
output_file.write(text)
window.title(f"Thecleverprogrammer - {filepath}")
window = tk.Tk()
window.title("Thecleverprogrammer")
window.rowconfigure(0, minsize=800, weight=1)
window.columnconfigure(1, minsize=800, weight=1)
txt_edit = tk.Text(window)
fr_buttons = tk.Frame(window, relief=tk.RAISED, bd=2)
btn_open = tk.Button(fr_buttons, text="Open", command=open_file)
btn_save = tk.Button(fr_buttons, text="Save As...", command=save_file)
btn_open.grid(row=0, column=0, sticky="ew", padx=5, pady=5)
btn_save.grid(row=1, column=0, sticky="ew", padx=5)
fr_buttons.grid(row=0, column=0, sticky="ns")
txt_edit.grid(row=0, column=1, sticky="nsew")
window.mainloop()
آموزش پروژه محور پایتون: ساخت فیلترهای اینستاگرام
حتی اگر یک بار در زندگی خود از اینستاگرام استفاده کرده باشید، حتماً متوجه این موضوع شدهاید که در هنگام آپلود تصویر، میتوانید از فیلترهای متنوعی استفاده کنید. این فیلترها برای بهبود کیفیت تصویر طراحی شدهاند. آنها نمونهای از الگوریتمهای پیچیده یادگیری ماشین هستند که در برای ارائه سرویس به اینستاگرام ساخته شدهاند. بنابراین، اگر این فیلترها توسط یادگیری ماشین ایجاد شدهاند، به این معنی است که میتوانیم فیلترهای اینستاگرام را با پایتون نیز ایجاد کنیم.
در این آموزش پروژه محور پایتون، نحوه ایجاد فیترهای زیبای اینستاگرام را با استفاده ازیادگیری ماشین به شما یاد میدهم. بهترین بخش کار این است که ما از پایتون استفاده میکنیم، و بزرگترین مزیت استفاده از چنین زبان محبوبی این است که تقریباً برای هر کار، پکیجهایی در آن وجود دارد.
ساخت فیلترهای اینستاگرام با پایتون چگونه ممکن است؟
ساخت یک شبکه عصبی برای ایجاد فیلترهای اینستاگرام کار پیچیدهای است، اما در این مقاله ما از کتابخانه Instafilter در پایتون استفاده خواهیم کرد که به ما در استفاده از فیلترهای اینستاگرام با پایتون کمک میکند.
اگر میخواهید بدانید که چگونه میتوانیم بدون استفاده از پکیج Instafilter چنین فیلترهای شگفتانگیزی ایجاد کنیم، تنها لازم است که پرسش خود را در بخش کامنتها مطرح کنید. حال بیایید ببینیم چگونه میتوانیم با این کتابخانه به ساخت فیلترهای اینستاگرام بپردازیم.
با استفاده از دستور pip ، به راحتی میتوانید این کتابخانه را نصب کنید. امیدوارم هنگام نصب این کتابخانه، با ارور مواجه نشوید.
pip install instafilter
کتابخانه دیگری که برای ایجاد فیلترهای اینستاگرام به آن نیاز داریم، Open Source Computer Vision Library of Python است که به آن OpenCV هم میگویند. اگر هرگز با OpenCV کار نکردهاید، میتوانید آن را به راحتی و با استفاده از دستور pip نصب کنید.
pip install opencv-python
برای استفاده از OpenCV ، آن را با نام cv2 (import cv2) وارد میکنیم. حالا بیایید در این آموزش پروژه محور پایتون، به ساخت فیلترهای اینستاگرام بپردازیم:
from instafilter import Instafilter
model = Instafilter("Lo-fi")
new_image = model("image.jpg")
# To save the image, use cv2
import cv2
cv2.imwrite("modified_image.jpg", new_image)
تصاویر ذخیره شده شما به این صورت خواهند بود:

امیدوارم این آموزش پروژه محور پایتون برای ایجاد فیلتر اینستاگرام، مورد پسند شما واقع شده باشد. سؤالات ارزشمند خود را در بخش کامنتها بپرسید.
در این آموزش پروژه محور پایتون، با چندین پروژه جذاب آشنا شدید. اگر دستتان گرم شده و میخواهید پروژه های حرفهایتر را هم امتحان کنید، این مطالب را از دست ندهید: