Học Python/Chương V
Diving in
sửaĐọc doc strings của module , lớp , hàm để lấy overview của chương trình này nó làm việc như thế nào . Thông thường , đừng lo lắng về những vấn đề bạn không hiểu .
Vì dụ : fileinfo.py
Có thể download ví dụ từ đây (http://diveintopython.org/download/diveintopython−examples−5.4.zip)
"""Framework for getting filetype−specific metadata. Instantiate appropriate class with filename. Returned object acts like a dictionary, with key−value pairs for each piece of metadata. import fileinfo info = fileinfo.MP3FileInfo("/music/ap/mahadeva.mp3") print "\\n".join(["%s=%s" % (k, v) for k, v in info.items()]) Or use listDirectory function to get info on all files in a directory. for info in fileinfo.listDirectory("/music/ap/", [".mp3"]):
Framework có thể được mở rộng bởi thêm những lớp cho các file riêng biệt , HTMLFileInfo, MPGFileInfo, return data.replace("\00", "").strip()
class FileInfo(UserDict): "store file metadata" def __init__(self, filename=None): UserDict.__init__(self) self["name"] = filename class MP3FileInfo(FileInfo): "store ID3v1.0 MP3 tags" tagDataMap = {"title" : ( 3, 33, stripnulls), "artist" : ( 33, 63, stripnulls), "album" : ( 63, 93, stripnulls), "year" : ( 93, 97, stripnulls), "comment" : ( 97, 126, stripnulls), "genre" : (127, 128, ord)} def __parse(self, filename): "parse ID3v1.0 tags from MP3 file" self.clear() try: fsock = open(filename, "rb", 0) try: fsock.seek(−128, 2) tagdata = fsock.read(128) finally: fsock.close() if tagdata[:3] == "TAG": for tag, (start, end, parseFunc) in self.tagDataMap.items(): self[tag] = parseFunc(tagdata[start:end]) except IOError: pass def __setitem__(self, key, item): if key == "name" and item: self.__parse(item) FileInfo.__setitem__(self, key, item) def listDirectory(directory, fileExtList): "get list of file info objects for files of particular extensions" fileList = [os.path.normcase(f) for f in os.listdir(directory)] fileList = [os.path.join(directory, f)for f in fileList if os.path.splitext(f)[1] in fileExtList] def getFileInfoClass(filename, module=sys.modules[FileInfo.__module__]): "get file info class from filename extension" subclass = "%sFileInfo" % os.path.splitext(filename)[1].upper()[1:] return hasattr(module, subclass) and getattr(module, subclass) or FileInfo return [getFileInfoClass(f)(f) for f in fileList]
if __name__ == "__main__":
for info in listDirectory("/music/_singles/", [".mp3"]): print "\n".join(["%s=%s" % (k, v) for k, v in info.items()]) print
- Đây là chương trình output phụ thuộc trên files trên đỉa cứng của bạn . Để lấy luồng xuất có nghĩa ,bạn sẽ cần thay đổi đường dẫn thư mục tới thư mục trên máy của bạn .
album= artist=Ghost in the Machine title=A Time Long Forgotten (Concept genre=31 name=/music/_singles/a_time_long_forgotten_con.mp3 year=1999 comment=http://mp3.com/ghostmachine album=Rave Mix artist=***DJ MARY−JANE*** title=HELLRAISER****Trance from Hell genre=31 name=/music/_singles/hellraiser.mp3 year=2000 comment=http://mp3.com/DJMARYJANE album=Rave Mix artist=***DJ MARY−JANE*** title=KAIRO****THE BEST GOA genre=31 name=/music/_singles/kairo.mp3 year=2000
Importing Modules Using from module import
sửaPython có 2 cách để import modules . Cả hải thì hữu dụng , và bạn sẽ biết khi nào dùng cài nào .
Đây là cách cơ bản from module import syntax :
- from module import * trong Python thì giống như sử dung module trong Perl .
- from module import * trong Python thì giống như import module.* trong java .
Ví dụ : import module vs. from module import
>>> import types >>> types.FunctionType <type 'function'> >>> FunctionType Traceback (innermost last): File "<interactive input>", line 1, in ? NameError: There is no variable named 'FunctionType' >>> from types import FunctionTyp >>> FunctionType <type 'function'>
- module types không chứa phương thức , nó chỉ có thuộc tính cho mổi đối tương Python .
- FunctionType của chính nó thì không được định nghĩa trong không gian namespace .
- Cú pháp này imports thuộc tính FunctionType từ lọai module vào trong vùng không gian .
- Bây giờ FunctionType có thể truy cậy trực tiếp , không cần tham chiếu tới types.
Khi nào bạn sử dụng from module import ?
- Nếu bạn truy cập thuộc tính và phương thức thường hơn
- Nếu bạn muốn chọn lọc import vài thuộc tính và phương thức nhưng không phải cái khác , sử dụng from module import.
- Nếu module chứa thuộc tính hay hàm với cùng tên như là một trong module của bạn , bạn cần dùng module tránh xung đột tên .
Defining classes
sửaPython thì hòan tòan hướng đối tượng : bạn có thể đinh nghĩa lớp của chính mình , kế thừa từ lớp được xây dựng bởi chính bạn.
Ví dụ : The Simplest Python Class
class Loaf: pass
- Tên của lớp này là Loaf , và nó không kế thừa tứ bất cứ lớp nào khác . Tên lớp thường viết Hoa, nhưng điều này chỉ là một quy ước ,không đòi hỏi.
- Lớp này không định nghĩa bất cứ thuộc tính hay phương thức nào , nhưng về cú pháp , cần thiết để làm một vài điều gì đó trong định nghĩa , vì vậy bạn dùng pass . Đây là một từ dành riêng của python mà có nghĩa là "đi tiếp , không làm gì khác ở đây ". Nó là một phát biểu mà không làm gì cả .
- Nếu như bạn đóan được điều này , nhưng mỗi thứ trong lớp thì phải thụt vào , giống như code trong hàm , if statement, for loop, ...
Ví dụ : Defining the FileInfo Class
from UserDict import UserDict class FileInfo(UserDict):
Trong python , lớp ông bà của lớp thì đơn giản là được liệt kê vào trong ngoặc đơn lập tức sau tên lớp . Vì vậy lớp FileInfo được kế thừa từ lớp UserDict (được import từ module UserDict). UserDict là một lớp mà họat động giống một từ điển .
Initializing and Coding Classes
sửaVí dụ : Initializing the FileInfo Class
class FileInfo(UserDict): "store file metadata" def __init__(self, filename=None):
- Lớp có thể doc strings , giống module và hàm . __init__ thì được gọi lập tức sau một đối tương của lớp được tạo .
Ví dụ : Coding the FileInfo Class
class FileInfo(UserDict): "store file metadata" def __init__(self, filename=None): UserDict.__init__(self) self["name"] = filename
- Vài ngôn ngữ lập trình hướng đối tượng giả giống Powerbuilder có một khái niệm "extending" constructors và các sự kiện khác , Nơi mà phương thức ông bà được gọi một cách tự động trước khi phương thức con cháu được thực thi . Python không phải làm điều này ; Bạn phải luôn luôn gọi rỏ ràng những hàm thích hợp trong lớp tổ tiên .
- Lớp họat động giống như một thư viện .
Knowing When to Use self and __init__
sửaKhi định nghĩa lớp phương thức của bạn , bạn cần liệt kê rỏ ràng self như là tham số đầu tiên phương thúc ,bao gồm __init__ . Khi bạn gọi một phương thức của lớp tổ tiên từ trong lớp của bạn ,bạn cần phải bao gồm tham số self . Nhưng khi bạn gọi lớp phương thức của bạn từ bên ngòai , bạn không cần đặc tả bất cứ thứ gì cho tham số self . Python tự động thêm tham chiếu self cho bạn . Nó thì không thật sự mâu thuẩn , nhưng nó có thể xuất hiện mâu thuẩn bởi vì nó tin cậy trên sự khác nhau ( giữa phương thức giới hạn và không giới hạn) . Tất cả lớp trong Python làm việc cùng 1 cách tương tự , vì vậy một khi bạn đã học một , bạn học hết tất cả chúng . Nếu bạn quên mọi điều khác , nhớ một điều , vì vậy tôi hưa nó sẽ dẫn bạn lên.
Chú ý rằng phương thức __init__ không bao giờ trả về giá trị .
Instantiating classes
sửaThí dụ cụ thể lớp trong Python thì thẵng thắng . Để thuyết minh một lớp , đơn giản gọi lớp như là nó thì ở trong hàm , truyền vào tham số cho phương thức __init__ . Giá trị trả về sẽ là đối tượng được tạo mới .
Ví dụ . Creating a FileInfo Instance
>>> import fileinfo >>> f = fileinfo.FileInfo("/music/_singles/kairo.mp3") >>> f.__class__ <class fileinfo.FileInfo at 010EC204> >>> f.__doc__ 'store file metadata' >>> f {'name': '/music/_singles/kairo.mp3'}
Bạn đang tạo một đối tượng của lớp FileInfo (được định nghĩa trong module fileinfo ) và quy cho đối tượng được tạo mới tới biến f . Bạn đang truyền một tham số , /music/_singles/kairo.mp3 , sẽ kết thúc như là tham số filename trong phương thứ __init__ của FileInfo . Mỗi lớp instance có một thuộc tính built-in , __class__ ( chú ý rằng sự miêu tả điều này bao gồm địa chỉ vật lý của instance trong máy )
Bạn có thể truy cậy doc string của instance như là với một hàm hay một module . Tất cả instance của class chia sẽ doc string giống nhau .
Garbage Collection
sửaNếu tạo instances mới thì dể dàng , thì hủy chúng dể dàng hơn . Không có nhu cầu giải phóng instance rỏ ràng . Vì vậy chúng được giải phóng một cách tự động khi biến được ấn định thì ngòai phạm vi . are rare in Python.
Ví dụ : Trying to Implement a Memory Leak
>>> def leakmem(): ... f = fileinfo.FileInfo('/music/_singles/kairo.mp3') ... >>> for i in range(100): ... leakmem()
- Mỗi làn hàm leakmen được gọi , bạn đang tao một instance của FileInfo và ấn định nó tới biến f , là một biến đia phương trong hàm . Sau khi hàm kết thúc , f được giải phóng .
- Không vấn đề , bao nhiêu lần bạn gọi hàm leakmen , nó sẽ không bao giờ leak memory, bởi vì mỗi lần , python sẽ hủy lớp FileInfo mới trước khi trả về leakmem . Giới hạn của kỉ thuật "garbage collection " được "reference counting". Python giữ một danh sách tham chiếu tới mỗi một instance được tạo . Trong ví dụ trên , chỉ có một tham chiếu tới "FileInfo instance" , biến f địa phương . Khi hàm kết thúc , biến f the variable f ngoài phạm vi , vì vậy bộ đếm tham chiếu xuống 0 , và Python hủy tự động instance .
Exploring UserDict : A wrapper class
sửaNhư bạn đã xem , FileInfo là một lớp mà họat động giống một dictionanry . Xa hơn , chúng ta xem lớp UserDict trong Userm module , là tổ tiên của lớp FileInfor . Điều này thì không đặc biệt , lớp được viết trong python và được lưu trử trong một file .py . Giống bất cứ đọan code nào khác . Trong trường hợp đặc biệt , nó lưu trữ trong lib directory trong cài đặt python của bạn .
Ví dụ : Defining the UserDict Class
class UserDict: def __init__(self, dict=None): self.data = {} if dict is not None: self.update(dict)
- Chú ý rằng UserDict là lớp cơ sở , không kế thừa từ bất kì lớp khác .
- Phương thức __init__ này bạn viết đè lên lớp FileInfo . Chú ý rằng danh sách tham số trong lớp tổ tiên này thì khác biệt hơn . Điều đó thì ổn ; mỗi lớp con có thể có tập hợp tham số của chính nó , củng lâu như là nó gọi tổ tiên với tham số đúng . lớp tổ tiên có một cách để khởi tạo giá trị ( bởi truyền một dictionary trong tham số dict)FileInfo không sử dụng .
- Python hổ trợ thuộc tính dử liệu ( gọi "instance variables" trong java và Powerbuilder , và "member variables" trong C++ ) . Thuộc tính dữ liệu là những miếng dữ liệu được giử lại một instance của một lớp . Trong trường hợp này , mỗi một instance của UserDict sẽ có một thuộc tính dữ liệu . Để tham chiếu thuộc tính này từ code bên ngòai lớp . Với quy ước , tất cả thuôc tính dự liệu thì được khởi tạo tới giá trị hợp lí trong phương thức __init__ . Tuy nhiên , điều này thì không nhất thiết đòi hỏi ,kể từ thuộc tính dữ liệu , giống biến địa phương .
- Phương thức update là một sao chép . Nó sao chép tất cả khóa và giá trị từ dictionary tới cái khác. Điều này không rỏ ràng .
Ví dụ : UserDict Normal Methods
def clear(self): self.data.clear() def copy(self): if self.__class__ is UserDict: return UserDict(self.data) import copy return copy.copy(self) def keys(self): return self.data.keys() def items(self): return self.data.items() def values(self): return self.data.values()
- clear một lớp phương thức bình thường , nó thì sẳn sàng để được gọi bởi bất cứ ai, bất cứ lúc nào. chú ý rằng clear , giống tất cả phương thức lớp , có self như nó là tham số đầu tiên ( Nhớ rằng bạn không bao gồm self khi bạn gọi phương thức
Ví dụ : Inheriting Directly from Built−In Datatype dict
class FileInfo(dict): "store file metadata" def __init__(self, filename=None): self["name"] = filename
- Tham chiếu đầu tiên là cái mà bạn không cần import vào module UserDict , kế từ khi dict là một a built−in datatype và luôn sẳn sàng. Tham chiếu thức hai là cái mà bạn đang kế thừa từ dict trực tiếp, thay vì từ UserDict.UserDict.
- Tham số thứ ba là subtle nhưng quan trọng . Bởi vì cách UserDict làm việc bên trong , nó đòi hỏi bạn để gọi bằng tay .
Special class methods
sửaThêm vào lớp phương thức bình thường , có một số phương thức đặc biệt mà lớp Python có thể định nghĩa . Thay vì gọi trực tiếp bởi code ( giống phương thức bình thường ) , phương thức đặc tả được gọi cho bạn bởi python trong trường hợp đặc biệt .
Getting and Setting Items
sửaVí dụ : The __getitem__ Special Method
def __getitem__(self, key): return self.data[key] >>> f = fileinfo.FileInfo("/music/_singles/kairo.mp3") >>> f {'name':'/music/_singles/kairo.mp3'} >>> f.__getitem__("name") '/music/_singles/kairo.mp3' >>> f["name"] '/music/_singles/kairo.mp3'
- Phương thức đặc biết __getitem__ trông khá đơn giản . Giống như phương thức clear bình thướng , keys, and values. Bạn có thể gọi phương thức __getitem__ trực tiếp , nhưng trong thực hành bạn sẽ không thật sự làm điều đó ; Cách đúng để sử dụng __getitem__ là Python gọi nó cho bạn .
- Điều này giống cú pháp bạn sẽ dùng để lấy giá trị dictionary , và trong thực tế nó trả về giá trị bạn mong muốn . Không chỉ bạn có thể gọi nó bởi chính bạn , bạn có thẻ lấy Python để gọi nó cho bạn với sử dụng cú pháp đúng .
Ví dụ : The __setitem__ Special Method
def __setitem__(self, key, item): self.data[key] = item >>> f {'name':'/music/_singles/kairo.mp3'} >>> f.__setitem__("genre", 31) >>> f {'name':'/music/_singles/kairo.mp3', 'genre':31} >>> f["genre"] = 32 >>> f {'name':'/music/_singles/kairo.mp3', 'genre':32}
- Giống phương thức __getitem__ , __setitem__ đơn giản gọi một lần tới dictionary thật self.data để nó làm việc . Và giống __getitem__, bạn sẽ muốn gọi nó một cách bình thường trực tiếp giống cái này; Python gọi __setitem__ cho bạn khi bạn dùng cú pháp đúng .
Ví dụ : Overriding __setitem__ in MP3FileInfo
def __setitem__(self, key, item): if key == "name" and item: self.__parse(item) FileInfo.__setitem__(self, key, item)
- Chú ý rằng phương thức __setitem__ thì được định nghĩa một cách chính xác cùng cách như phương thức tổ tiên. Điều này quan trọng , kể từ khi Python gọi phương thức cho bạn , và nó mong chờ nó được định nghĩa với một số number của tham số .
Advanced Special class methods
sửaPython có nhiều phương thức đặc biệt như __getitem__ và __setitem__ . Đôi khi chúng để bạn bắt chước và bạn không biết .
Ví dụ này chỉ vài phương thức đặc biệt trong UserDict .
Ví dụ : More Special Methods in UserDict
def __repr__(self): return repr(self.data) def __cmp__(self, dict): if isinstance(dict, UserDict): return cmp(self.data, dict.data) else: return cmp(self.data, dict) def __len__(self): return len(self.data) def __delitem__(self, key): del self.data[key]
- __repr__ là một phương thức đặc biệt mà được gọi khi bạn gọi repr(instance). hàm repr là một hàm built−in trả về một chuổi miêu tả đối tượng . Nó làm việc trên bất cứ đối tượng nào , không chỉ lớp instances. Bạn đã quen thuộc tường tận với rept rồi ,mà bạn không biết . Trong tương tác window , khi bạn gỏ một tên biến và nhấn ENTER , Python sử dụng repr để hiển thị giá trị của biến . Tạo một từ điển d với vài dử liệu và sau đó in repr(d) để thấy chính bạn .
- __cmp__ được gọi khi bạn so sánh lớp instances . Trong phát sinh , bạn có thể so sánh bất cứ đối tượng Python , không chỉ lớp instances , bởi sử dụng == . Có luật để định nghĩa built-in datatypes . Trong instance , dictionaries thì bằng khi chúng có cùng độ khóa và giá trị . Chuỗi thì bằng khi chúng thì cùng độ dài và chứa những kí tự tuần tự giống nhau . Trong lớp instances , bạn có thể định nghĩa phương thức __cmp__ và code so sánh luận lý của chính bạn và sau đó bạn có thể dùng == để so sánh instances của lớp của bạn và Python sẽ gọi phương thức đặc biệt __cmp__ cho bạn .
- __len__ được gọi khi bạn gọi len(instance) , hàm len là một hàm built-in mà trả về độ dài của đối tượng . __len__ làm việc trên bất cứ đối tượng mà có độ dài . len của một chuổi là số kí tự của nó . len của từ điển là số khóa của nó . len của danh sách hay tuple là số phần tử của nó . cho lớp instances , định nghĩa phương thức __len__ và code tính tóan chiều dài của chính bạn , và khi gọi len(instance) thì Python sẽ gọi phương thúc đặc biệt __len__ cho bạn .
- __delitem__ được gọi khi bạn gọi del del instance[key], mà bạn có thể nhớ như là cách để delete phần tử riêng lẻ từ từ điển . Khi bạn dùng del trong lớp instance , Python gọi phương thức __delitem__ cho bạn .
Introducing class Attributes
sửaVí dụ : Introducing Class Attributes
class MP3FileInfo(FileInfo): "store ID3v1.0 MP3 tags" tagDataMap = {"title" : ( 3, 33, stripnulls), "artist" : ( 33, 63, stripnulls), "album" : ( 63, 93, stripnulls), "year" : ( 93, 97, stripnulls), "comment" : ( 97, 126, stripnulls), "genre" : (127, 128, ord)}
>>> import fileinfo >>> fileinfo.MP3FileInfo <class fileinfo.MP3FileInfo at 01257FDC> >>> fileinfo.MP3FileInfo.tagDataMap {'title': (3, 33, <function stripnulls at 0260C8D4>), 'genre': (127, 128, <built−in function ord>), 'artist': (33, 63, <function stripnulls at 0260C8D4>), 'year': (93, 97, <function stripnulls at 0260C8D4>), 'comment': (97, 126, <function stripnulls at 0260C8D4>), 'album': (63, 93, <function stripnulls at 0260C8D4>)} >>> m = fileinfo.MP3FileInfo() >>> m.tagDataMap {'title': (3, 33, <function stripnulls at 0260C8D4>), 'genre': (127, 128, <built−in function ord>), 'artist': (33, 63, <function stripnulls at 0260C8D4>), 'year': (93, 97, <function stripnulls at 0260C8D4>), 'comment': (97, 126, <function stripnulls at 0260C8D4>), 'album': (63, 93, <function stripnulls at 0260C8D4>)}
- MP3FileInfo là lớp của chính nó , không bất cứ instance đặc biệt của lớp .
- tagDataMap là một thuộc tính của lớp : thật vậy , một thuộc tính của lớp . Nó thì sẵn sàng trước khi tạo bất kì instances của lớp .
Ví dụ : Modifying Class Attributes
>>> class counter: ... count = 0 ... def __init__(self): ... self.__class__.count += 1 ... >>> counter <class __main__.counter at 010EAECC> >>> counter.count 0 >>> c = counter() >>> c.count 1 >>> counter.count 1 >>> d = counter() >>> d.count 2 >>> c.count 2 >>> counter.count
- count là một thuộc tính của lớp counter .
- __class__ là một thuộc tính built-in của mỗi lớp instance . Nó là một tham chiếu tới lớp mà self là một instance của ( trong trường hợp này , lớp counter ).
- Vì vậy count là một thuộc tính lớp , nó thì sẵn sàng thông qua tham chiếu trực tiếp tới lớp . Trước khi bạn tạo bất kì instances của lớp .
- Tạo một instance của lớp , gọi phương thức __init__ , cái mà làm tặng thuộc tính count của lớp lên một . Điều này ảnh hưởng lên lớp của chính nó , không chỉ tạo mới instance .
- Tạo một instance thứ hai sẽ tặng thuộc tính count lên lần nửa . Chú ý , thuộc tính lớp được chia sẽ bơi lớp và tất cả instances của lớp .
Private Functions
sửaGiống như hầu hết các ngôn ngữ , Python có khái niệm phần tử riêng ( private elements ) :
- Hàm riêng , không thể được gọi từ bên ngòai module của chúng .
- Phương thức lớp riêng , không thể được gọi từ bên ngòai lớp của chúng .
- Thuộc tính riêng , không thể truy cậy từ bên ngòai lớp của chúng ·
Không giống như phần đông ngôn ngữ , không chắc Hàm , phương thức hay thuộc tính của Pythong là private hay public được xác định hòan tòan bởi tên của nó .
Nếu tên của một hàm Python , phương thức lớp hay thuộc tính bắt đầu với(nhưng không kết thúc với ) hai đường gạch dưới , nó là private , mọi thứ khác là public . Python không có khái niệm lớp phương thức protected ( truy cập chỉ trong lớp của chính nó và các lớp con cháu ). Phương thức lớp thì một trong hai private hay public .
Ví dụ : Trying to Call a Private Method
>>> import fileinfo >>> m = fileinfo.MP3FileInfo() >>> m.__parse("/music/_singles/kairo.mp3") Traceback (innermost last): File "<interactive input>", line 1, in ? AttributeError: 'MP3FileInfo' instance has no attribute '__parse'
- Nếu bạn cố gắng gọi phương thức riêng , Python sẽ ném một ngọai lệ , nói rằng cái đó là phương thức không tồn tại . Dĩ nhiên là nó có tồn tại , nhưng nó là private , vì vậy nó không thể truy cậo bên ngòai lớp . Không có cái gì trong Python thật sự là private . Bạn có thể truy cập phương thức __parse của lớp MP3FileInfo bởi tên _MP3FileInfo__parse . Công nhận điều này thì thú vị , nhưng hứa không bao giờ làm điều đó trong code thật sự .