Python自動化測試面試題-編程篇


目錄

前言

隨着行業的發展,編程能力逐漸成為軟件測試從業人員的一項基本能力。因此在筆試和面試中常常會有一定量的編碼題,主要考察以下幾點。

  • 基本編碼能力及思維邏輯
  • 基本數據結構(順序表、鏈表、隊列、棧、二叉樹)
  • 基本算法(排序、查找、遞歸)及時間復雜度

除基本算法之外,筆試面試中經常會考察以下三種思想:

  • 哈希
  • 遞歸
  • 分治

哈希

哈希即Python中的映射類型,字典和集合,鍵值唯一,查找效率高,序列(列表、元祖、字符串)的元素查找時間復雜度是O(n),而字典和集合的查找只需要O(1)。
因此哈希在列表問題中主要有兩種作用:

  1. 去重
  2. 優化查找效率

列表去重

列表去重在不考慮順序的情況下可以直接使用set()轉換(轉換后會自動排序),需要保持順序可以使用字典構建的fromkeys()方法,利用字典鍵值的唯一性去重。
不考慮順序:

l = [2,1,2,3,4,5,6,6,5,4,3,2,1]
result = list(set(l))
print(result)

運行結果:

[1, 2, 3, 4, 5, 6]

考慮順序:

l = [2,1,2,3,4,5,6,6,5,4,3,2,1]
s = set()
result = []
for i in l:
    if i in s:
        continue
    s.add(i)
    result.append(i)
print(result)

注意,這里如果使用:

if not i in result:
    result.append(i)

雖然看起來代碼簡單,但是列表in查找的的時間復雜度為O(n),not in的效率比in要差,每次都要進行n次比對。
上例中,使用了一個集合變量s來優化in查找,同時使用in代替not in。

Python3.6后字典按鍵值插入順序,如果使用Python3.6,也可以利用字典的有序性來去重,示例如下:

l = [2,1,2,3,4,5,6,6,5,4,3,2,1]
result = list({}.fromkeys(l).keys())
print(result)

運行結果:

[2, 1, 3, 4, 5, 6]

列表分組

一串字母數字組合的字符串,找出相同的字母或數字,並按照個數排序。

l = [1,2,3,'a','b','c',1,2,'a','b',3,'c','d','a','b',1]
set1 = set(l)
result = [(item, l.count(item)) for item in set1]
result.sort(key=lambda x:x[1], reverse=True)
print(result)

這里使用哈希的鍵值不重復性。當然也可以使用python自帶的groupby函數,代碼如下:

from itertools import groupby

l = [1,2,3,'a','b','c',1,2,'a','b',3,'c','d','a','b',1]
l.sort(key=lambda x: str(x))  # 分組前需要先排序
result = []
for item, group in groupby(l, key=lambda x: str(x)):
    result.append((item, len(list(group))))
result.sort(key=lambda x:x[1], reverse=True)
print(result)

海量數據top K

對於小數據量可以使用排序+切片,而對於海量數據,需要考慮服務器硬件條件。即要考慮時間效率,也要考慮內存占用,同時還要考慮數據特征。如果大量的重復數據,可以先用哈希進行去重來降低數據量。
這里我們使用生成器生成1000萬個隨機整數,求最大的1000個數,生成隨機數的代碼如下:

import random
import time
n = 10000 * 1000
k = 1000
print(n)
def gen_num(n):
    for i in range(n):
        yield random.randint(0, n)
l = gen_num(n)
  • 不限內存可以直接使用set()去重+排序
start = time.time()
l = list(set(l))
result = l[-k:]
result.reverse()
print(time.time()-start)

1000w個數據會全部讀入內存,set后列表自動為遞增順序,使用切片取-1000到最后的即為top 1000的數

  • 使用堆排可以節省一些內存
start = time.time()
result = heapq.nlargest(k, l)
print(time.time()-start)

這里是用來Python自帶的堆排庫heapq。使用nlargest(k,l)可以取到l序列,最大的k個數。

  • 較小內存可以分治策略,使用多線程對數據進行分組處理(略)

兩數之和

l=[1,2,3,4,5,6,7,8] 數據不重復,target=6,快速找出數組中兩個元素之和等於target 的數組下標。
注意,不要使用雙重循環,暴力加和來和target對比,正確的做法是單層循環,然后查找target與當前值的差,是否存在於列表中。
但是由於列表的in查詢時間復雜度是O(n),即隱含了一層循環,這樣效率其實和雙重循環是一樣的,都是O(n^2)。
這里就可以使用哈希來優化查詢差值是否在列表中操作,將O(n)降為O(1),因此總體的效率就會變成O(n^2)->O(n)。

l = [1,2,3,4,5,6,7,8]
set1 = set(list1)   # 使用集合已方便查找
target = 6

result = []
for a in set1:
    b = target - a
    if a < b < target and b in set1:   # 在集合中查找,為避免重復,判斷a為較小的那個值
        result.append((list1.index(a), list1.index(b)))   # 列表index取下標的操作為O(1) 
print(result)

遞歸問題

遞歸是一種循環調用自身的函數。可以用於解決以下高頻問題:

  • 階乘
  • 斐波那切數列
  • 跳台階、變態跳台階
  • 快速排序
  • 二分查找
  • 二叉樹深度遍歷(前序、中序、后序)
  • 求二叉樹深度
  • 平衡二叉樹判斷
  • 判斷兩顆樹是否相同

遞歸是一種分層推導解決問題的方法,是一種非常重要的解決問題的思想。遞歸可快速將問題層級化,簡單化,只需要考慮出口和每層的推導即可。
如階乘,要想求n!,只需要知道前一個數的階乘(n-1)!,然后乘以n即可,因此問題可以轉為求上一個數的階乘,依次向前,直到第一個數。
舉個通俗的例子:
A欠你10萬,但是他沒那么多錢,B欠A 8萬,C欠B 7萬 C現在有錢。因此你要逐層找到C,一層一層還錢,最后你才能拿到屬於你的10萬。

編寫遞歸函數有兩個要點:

  1. 出口條件,可以不止一個
  2. 推導方法(已知上一個結果怎么推導當前結果)

階乘

求n的階乘

  • 出口:n = 1 時,返回1
  • 推導:(n-1)層的結果 * n

代碼如下:

def factorial(n):
    if n == 1:  # 出口
        return 1
    return factorial(n-1) * n   # 自我調用求上一個結果,然后推導本層結果

也可以簡寫為 factorial = lambda n: 1 if n==1 else factorial(n-1) * n

斐波那切數列

斐波那切數列是 1 1 2 3 5 8 ...這樣的序列。前兩個數為1,后面的數為前兩個數之和。

  • 出口:n <= 2,返回1
  • 推導:(n-1)層的結果 + (n-2)層的結果

代碼如下:

def fib(n):
    if n<=2:
        return 1
    return fib(n-2) + fib(n-1) 

遞歸是一種分層簡化問題的解法,但不一定是效率最高的解法,比如斐波那切數列中,在求fib(n-2) 和 fib(n-1)時實際上反復求解了兩次fib(n-2)。
可以通過緩存來優化效率,代碼如下。

from functools import lru_cache

@lru_cache()
def fib(n):
    if n<=2:
        return 1
    return fib(n-2) + fib(n-1) 

跳台階、變態跳台階

  • 跳台階:一只青蛙,一次可以跳上1階,也可以跳上2階,問跳上n階有多少種跳法。
  • 變態跳台階:一只青蛙,一次可以跳上1階,可以一次跳上n階,為跳上n階有多少種跳法。

這個問題關鍵是邏輯分析每層的推導過程。
跳台階實際上就是一個從第二位開始的斐波那切數列:1 2 3 5 8 13 ...

  • 出口:n <= 2,返回n(即1時返回1,2時返回2)
  • 推導:(n-1)層的結果 + (n-2)層的結果

代碼如下:

jump1 = lambda n: n if n<=2 else jump1(n-2) + jump1(n-1)

變態跳台階只是推導方式不同,每一層的結果是上一層跳法的2倍。

  • 出口:n <= 2,返回n
  • 推導:(n-1)層的結果 * 2

代碼如下:

jump2 = lambda n: n if n<=2 else jump2(n-1)  * 2

快速排序

快速排序的是想是選一個基准數(如第一個數),將大於該數和小於該數的分成兩塊,然后在每一塊中重復執行此操作,直到該塊中只有一個數,即為有序。

  • 出口:列表長度為1(<2)時,返回列表
  • 選擇一個數,(將小於該數的序列)排序結果 + 基准數 + (大於該數的序列)排序結果
def quick_sort(l): 
    if  len(l) < 2:
         return l
    target = l[0]  # 以第一個數為基准數
    low_part, eq_part, high_part = [], [target], []
    for i in l[1:]:
        if i < target:
            low_part.append(i)
        elif i == target:
            eq_part.append(i)
        else:
            high_part.append(i)
    return quick_sort(low_part) + eq_part + quick_sort(high_part)

注:eq_part中應包含基准數target。

二分查找

二分查找需要序列首先有序。思想是先用序列中間數和目標值對比,如果目標值小,則從前半部分(小於中間數)重復此查找,否則從后半部分重復此查找。

  • 出口1:中間數和目標數相同,返回中間數下標
  • 出口2:列表為空,返回未找到
  • 推導:
def bin_search(l, n): 
    if not l:
        return None
    mid = len(l) // 2
    if l[mid] == n:
        return mid
    if l[mid] > n:
       return bin_search(l[:mid])
    return  bin_search(l[mid+1:])

二叉樹遍歷

二叉樹是非常常考的一種數據結構。其基本結構就是一個包含數據和左右節點的一種結構,使用Python類描述如下:

class Node(object):
    def __init__(self, data, left=None, right=None):
        self.data = data
        self.left = left
        self.right = right

二叉樹的遍歷分為分層遍歷(廣度優先)和深度遍歷(深度優先)兩種,其中深度遍歷又分為前序、中序、后序三種。

分層遍歷由於每次處理多個節點,使用循環解決更加方便一點(也可以是使用遞歸解決)。
分層遍歷代碼如下:

def lookup(root):
    row = [root]
    while(row):
        print(row)
        row = [kid for item in row for kid in (item.left, item.right) if kid]

深度遍歷

  • 出口:節點為None
  • 推導:
    • 前序:打印當前節點-》遍歷左子樹 -》遍歷右子樹
    • 中序:遍歷左子樹 -》打印當前節點-》遍歷右子樹
    • 后序:遍歷左子樹 -》遍歷右子樹-》打印當前節點

以前序為例:

def deep(root):
    if root is none:
        return
    [print(root.data), deep(root.left), deep(root.right)]

二叉樹最大深度

二叉樹最大深度即其左子樹深度和右子樹深度中最大的一個加上1(當前節點)。由於二叉樹的每一個左右節點都是一個二叉樹,這種層層嵌套的結構非常適合使用遞歸求解。

  • 出口:節點為空,深度返回0
  • 推導:左子樹深度和右子樹深度中最大的一個 + 1
def max_depth(root):
    if not root:
        return 0
    return max([max_depth(root.left), max_depth(root.right)]) + 1

相等二叉樹判斷

相等二叉樹是只,一個二叉樹,節點數據相同,左右子樹也完全相同。由於左右子樹也是一個二叉樹,因此也可以使用遞歸求解。

  • 出口:最后的節點都為None時,兩個相等,返回True
  • 推導:判斷兩個節點數據是否相等,左子樹是否相等(遞歸),右子樹是否相等(遞歸)
def is_same_tree(p, q):
    if p is None and q is None:
        return True
    elif p and q:
        return p.data == q.data and is_same_tree(p.left, q.left) and is_same_tree(p.right, q.right)

平衡二叉樹判斷

平衡二叉樹是指,一個二叉樹的左右子樹的高度差不超過1。平衡二叉樹的左右子樹也應該是平衡二叉樹,因此這也是一個遞歸問題。

  • 出口:兩個節點都為None時,返回True(平衡)
  • 判斷左子樹和右子樹深度的差<=1,並且左右子樹都是平衡二叉樹(遞歸)

注:這里需要使用以上求二叉樹深度的方法

def max_depth(root):
    if not root:
        return 0
    return max([max_depth(root.left), max_depth(root.right)]) + 1

def is_balance_tree(root):
    if root is None:
        return True
    return abs(max_depth(root.left)-max_depth(root.right))<=1 and is_balance_tree(root.left) and is_balance_tree(root.right)

其他

字符串統計

str1 = 'abcdaacddceea'
set1 = set(str1)
result = [(char, str1.count(char)) for char in set1]
print(result)

統計重復最多的n個字符

from collections import Counter
c = Counter('abcdaacddceea')
print(c.items())
print(c.most_common(3))

字符串反轉

  • 簡單字符串反轉
    Python中字符串反轉方式非常多,而且比較高效,可以使用反向切片或者reverse實現。
'abcefg'[::-1]

''.join(reversed('abcdefg'))
  • 包含數字字母的字符串,僅反轉字母
    可以通過遍歷判斷,如果是字母則取其對應反轉索引位置的字母,如果是數字則取當前數字。
a = 'abc123efg'
l = len(a)
r = []
for i,c in enumerate(a):
    r.append(c) if c.isdigit() else r.append(a[l-i-1])    
print(''.join(r))

判斷括號是否閉合

這是棧使用的一個經典示例,思路為,遇到正括號則入棧,遇到反括號則和棧頂判斷,如果匹配則匹配的正括號出棧(完成一對匹配),否則打印不匹配,break退出。

text = "({[({{abc}})][{1}]})2([]){({[]})}[]"

def is_closed(text)
    stack = []  # 使用list模擬棧, stack.append()入棧, stack.pop()出棧並獲取棧頂元素
    brackets = {')':'(',']':'[','}':'{'}  # 使用字典存儲括號的對應關系, 使用反括號作key方便查詢對應的括號
    for char in text:
        if char in brackets.values():   # 如果是正括號,入棧
            stack.append(char)
        elif char in brackets.keys():  # 如果是反括號
            if brackets[char] != stack.pop():  # 如果不匹配彈出的棧頂元素
                return False
    return True

print(is_closed(text))

合並兩個有序列表,並保持有序

常見的解法有兩種:

  • 連接 + 排序,時間復雜度度為O((m+n)log2(m+n))
  • 兩個隊列根據大小依次彈出,時間復雜度度約為O(m+n)

依次出隊列的邏輯為:

  • 隊列1為空,隊列2不為空,從隊列2彈出一個數據
  • 隊列2為空,隊列1不為空,從隊列1彈出一個數據
  • 兩個都不為空,判斷兩個對隊列頂端哪個小,從哪個列表彈出一個數據

以下為使用Python列表模擬兩個隊列依次彈出的示例。
由於Python列表尾部彈出list.pop()的的操作效率O(1),比首部彈出list.pop(0)的操作效率O(n)更高,因此我們先按從大到小排序,最后在執行一次反轉。

list1 = [1,5,7,9]
list2 = [2,3,4,5, 6,8,10,12,14]
result = []
for i in range(len(list1) + len(list2)):
    if list1 and not list2:
        result.append(list1.pop())
    elif list2 and not list1:
        result.append(list2.pop())
    else:
        result.append(list1.pop()) if list1[-1] > list2[-1] else result.append(list2.pop())  # 彈出頂端大的數
result.reverse()  # 執行反轉
print(result)

兩個隊列實現一個棧

隊列是先入先出,棧是先入后出。
使用兩個隊列實現棧的方式有很多種,主要分為優化入棧和優化出棧兩種,以下為優化入棧的一種實現方法。

  • 入棧時直接存入隊列q1
  • 出棧時,將q1中元素依次放入q2, 直到最后一個元素,彈出元素,然后將q2中元素重新依次放回q1

實現代碼如下:

import queue

class Stack(object):
    def __init__(self):
        self.q1 = queue.Queue()
        self.q2 = queue.Queue()

    def push(self, value):
        self.q1.put(value)

    def pop(self):
        while self.q1.qsize() > 1:
            self.q2.put(self.q1.get())
        value = self.q1.get()
        while not self.q2.empty():
            self.q1.put(self.q2.get())
        return value

測試代碼:

s = Stack()
[s.push(i) for i in [1,2,3,4,5,6,7]]
print(s.pop())
print(s.pop())
print(s.pop())
print(s.pop())

打印結果為:

7
6
5
4


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM