如何快速學會操控 Excel, PDF 與爬蟲程式?

  • 您在公司的非資訊部門上班,學校念的不是理工科系?
  • 您沒有撰寫過程式語言,對撰寫多行程式碼有心裡障礙?
  • 資訊部門的同事很忙,您想嘗試幫自己的部門做一些電腦作業的自動化?

如果您的經歷背景跟上面敘述得很類似,但是工作上又常會需要重複操作 Excel, PDF 與網頁動作的話,或許您得到的結論就是去學一個可以操控這些界面的程式語言吧!? 本篇文章要跟您說,有比 Python 更容易學的低代碼工具,可以幫您更快達到目的哦!

第一個例子:
使用 Python 撰寫對 Excel 檔案寫入十行 “Hello World” 的程式

from openpyxl import Workbook
from openpyxl.utils import get_column_letter

wb = Workbook()
dest_filename = 'empty_book.xlsx'
ws1 = wb.active
ws1.title = "示範工作表"
for row in range(1, 10):
    ws1.append(["Hello World!"])
wb.save(filename = dest_filename)

第二個例子:
讀取一個範例 pdf 檔案的第一頁內容。

from PyPDF2 import PdfReader

reader = PdfReader("example.pdf")
page = reader.pages[0]
text = page.extract_text()
print("文件第一頁的內容如下:" + text)

第三個例子:
使用 Python 進行 Google 搜尋,範例程式參考自 Office 指南

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

options = webdriver.ChromeOptions() 
options.add_experimental_option("excludeSwitches", ["enable-logging"])
browser = webdriver.Chrome(options=options)

browser.get("https://www.google.com")
inputElement = browser.find_element("name","q")
inputElement.send_keys("Power Automate 電腦版 教學")
inputElement.submit()
resultLocator = "//a/h3"

try:
    WebDriverWait(browser, 10).until(EC.presence_of_element_located((By.XPATH, resultLocator)))
    page1_results = browser.find_elements(By.XPATH, resultLocator)
    for item in page1_results:
        print(item.text)
except TimeoutException:
    print('TimeOut!')