python学习之文件操作|老男孩Python培训周末班

    /    2019-05-31

刚刚学完文件操作,现学现卖,这就整理起来咯。文件的操作,归根结底就只有两种:打开文件、操作文件

一、打开文件:文件句柄 = open('文件路径', '模式')

python中打开文件有两种方式,即:open(...) 和  file(...),本质上前者在内部会调用后者来进行文件操作,在这里我们推荐使用open,解释

二、操作文件

操作文件包括了文件的读、写和关闭,首先来谈谈打开方式:当我们执行 文件句柄 = open('文件路径', '模式')操作的时候,要传递给open方法一个表示模式的参数:

打开文件的模式有:

  • r,只读模式(默认)。

  • w,只写模式。【不可读;不存在则创建;存在则删除内容;】

  • a,追加模式。【可读;   不存在则创建;存在则只追加内容;】

  • "+" 表示可以同时读写某个文件

  • r+,可读写文件。【可读;可写;可追加】

  • w+,先写再读。【这个方法打开文件会清空原本文件中的所有内容,将新的内容写进去,之后也可读取已经写入的内容】

  • a+,同a

"U"表示在读取时,可以将 \r \n \r\n自动转换成 \n (注意:只能与 r 或 r+ 模式同使用)

  • rU

  • r+U

  • rbU

  • rb+U

"b"表示处理二进制文件(如:FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)

  • rb

  • wb

  • ab

 以下是file操作的源码解析:

class file(object):
      def close(self)# real signature unknown; restored from __doc__
        关闭文件
        """close() -> None or (perhaps) an integer.  Close the file.
        Sets data attribute .closed to True.  A closed file cannot be used for
        further I/O operations.  close() may be called more than once without
        error.  Some kinds of file objects (for example, opened by popen())
        may return an exit status upon closing.
        "
""
     def fileno(self)# real signature unknown; restored from __doc__
        文件描述符   
         """fileno() -> integer "file descriptor".
        This is needed for lower-level file interfaces, such os.read(). "
""
        return 0    
    def flush(self)# real signature unknown; restored from __doc__
        刷新文件内部缓冲区
        """ flush() -> None.  Flush the internal I/O buffer. """
        pass
    def isatty(self)# real signature unknown; restored from __doc__
        判断文件是否是同意tty设备
        """ isatty() -> true or false.  True if the file is connected to a tty device. """
        return False
    def next(self)# real signature unknown; restored from __doc__
        获取下一行数据,不存在,则报错
        """ x.next() -> the next value, or raise StopIteration """
        pass
    def read(self, size=None)# real signature unknown; restored from __doc__
        读取指定字节数据
        """read([size]) -> read at most size bytes, returned as a string.
        If the size argument is negative or omitted, read until EOF is reached.
        Notice that when in non-blocking mode, less data than what was requested
        may be returned, even if no size parameter was given."
""
        pass
    def readinto(self)# real signature unknown; restored from __doc__
        读取到缓冲区,不要用,将被遗弃
        """ readinto() -> Undocumented.  Don't use this; it may go away. """
        pass
    def readline(self, size=None)# real signature unknown; restored from __doc__
        仅读取一行数据
        """readline([size]) -> next line from the file, as a string.
        Retain newline.  A non-negative size argument limits the maximum
        number of bytes to return (an incomplete line may be returned then).
        Return an empty string at EOF. "
""
        pass
    def readlines(self, size=None)# real signature unknown; restored from __doc__
        读取所有数据,并根据换行保存值列表
        """readlines([size]) -> list of strings, each a line from the file.         
        Call readline() repeatedly and return a list of the lines so read.
        The optional size argument, if given, is an approximate bound on the
        total number of bytes in the lines returned. "
""
        return []
    def seek(self, offset, whence=None)# real signature unknown; restored from __doc__
        指定文件中指针位置
        """seek(offset[, whence]) -> None.  Move to new file position.
        Argument offset is a byte count.  Optional argument whence defaults to
        0 (offset from start of file, offset should be >= 0); other values are 1
        (move relative to current position, positive or negative), and 2 (move
        relative to end of file, usually negative, although many platforms allow
        seeking beyond the end of a file).  If the file is opened in text mode,
        only offsets returned by tell() are legal.  Use of other offsets causes
        undefined behavior.
        Note that not all file objects are seekable. "
""
        pass
    def tell(self)# real signature unknown; restored from __doc__
        获取当前指针位置
        """ tell() -> current file position, an integer (may be a long integer). """
        pass
    def truncate(self, size=None)# real signature unknown; restored from __doc__
        截断数据,仅保留指定之前数据
        """ truncate([size]) -> None.  Truncate the file to at most size bytes.
        Size defaults to the current file position, as returned by tell().“"
"
        pass
    def write(self, p_str): # real signature unknown; restored from __doc__
        写内容
        "
""write(str) -> None.  Write string str to file.
        Note that due to buffering, flush() or close() may be needed before
        the file on disk reflects the data written."""
        pass
    def writelines(self, sequence_of_strings): # real signature unknown; restored from __doc__
        将一个字符串列表写入文件
        "
""writelines(sequence_of_strings) -> None.  Write the strings to the file.
         Note that newlines are not added.  The sequence can be any iterable object
         producing strings. This is equivalent to calling write() for each string. """
        pass
    def xreadlines(self): # real signature unknown; restored from __doc__
        可用于逐行读取文件,非全部
        "
""xreadlines() -> returns self.
        For backward compatibility. File objects now include the performance
        optimizations previously implemented in the xreadlines module. """
        pass          
file Code

针对上面源码中的个方法,可以具体看一下在实际操作中的用例:

obj1 = open('filetest.txt','w+')
obj1.write('I heard the echo, from the valleys and the heart\n')
obj1.writelines(['Open to the lonely soul of sickle harvesting\n',
                 'Repeat outrightly, but also repeat the well-being of\n',
                 'Eventually swaying in the desert oasis'])
obj1.seek(0)
print obj1.readline()
print obj1.tell()
print obj1.readlines()
obj1.close()

我们以‘w+’的打开方式为例,write是向文件中写入一个字符串,而writelines是想文件中写入一个字符串数组。seek(0)方法是将指针指向其实位置,因为在写的过程中,指针的标记是随着写入的内容不断后移的,seek方法可以将指针移动到指定位置,而这个时候就指向0位置,从这个位置开始读,就可以读到刚刚写入的所有内容了;readline()是从指针位置读取一行,所以在这里,执行readline会将刚刚写入文件中的第一行读取出来;tell是指出指针当前的位置,这个时候执行tell()方法,指针指向了第二行的起始位置;之后的readlines方法,则会将文件当前指针之后的剩余内容按行读入数组中。下图是程序执行后文件和控制台的结果:

尽管刚刚使用'w+'的方式打开文件,但是事实上这种打开方式在文件处理中并不常用,曾一度被我们老师评为‘无意义’,因为用‘w+’方法会清空原文件里所有的东西~

(0)

分享至