pandas.DataFrame.to_sql

本文轉載自查看原文 2020-07-05 16:11 1321

DataFrame.to_sql（self，name ： str，con，schema = None，if_exists ： str = 'fail'，index ： bool = True，index_label = None，chunksize = None，dtype = None，method = None） → 無 [資源]

將存儲在DataFrame中的記錄寫入SQL數據庫。

支持SQLAlchemy [1]支持的數據庫。可以新建，追加或覆蓋表。

參量

名稱 str

SQL表的名稱。

con sqlalchemy.engine.Engine或sqlite3.Connection

使用SQLAlchemy可以使用該庫支持的任何數據庫。為sqlite3.Connection對象提供了舊版支持。用戶負責處理和處置SQLAlchemy connectable的連接，請參見此處

模式 str，可選

指定模式（如果數據庫支持）。如果為None，請使用默認架構。

if_exists {'fail'，'replace'，'append'}，默認為'fail'

如果表已經存在，該如何表現。

失敗：引發ValueError。
replace：在插入新值之前刪除表。
append：將新值插入現有表。

索引布爾值，默認為True

將DataFrame索引寫為列。使用index_label作為表中的列名。

index_label str或序列，默認為無

索引列的列標簽。如果給出None（默認）並且 index為True，則使用索引名。如果DataFrame使用MultiIndex，則應給出一個序列。

chunksize int，可選

指定一次要寫入的每個批次中的行數。默認情況下，所有行將一次寫入。

dtype dict或標量，可選

指定列的數據類型。如果使用字典，則鍵應為列名，值應為SQLAlchemy類型或sqlite3傳統模式的字符串。如果提供了標量，它將應用於所有列。

方法 {None，'multi'，callable}，可選

控制使用的SQL插入子句：

無：使用標准SQL INSERT子句（每行一個）。
'multi'：在單個INSERT子句中傳遞多個值。
可簽名的。(pd_table, conn, keys, data_iter)

詳細信息和示例可調用實現可以在部分insert方法中找到。

0.24.0版中的新功能。

加薪

ValueError: 當表已經存在並且if_exists為'fail'時（默認）。

也可以看看

read_sql: 從表中讀取一個DataFrame。

筆記

如果數據庫支持，則時區感知日期時間列將與SQLAlchemy 一起寫為類型。否則，日期時間將被存儲為時區，而不知道原始時區的本地時間戳。Timestamp with timezone

0.24.0版中的新功能。

參考資料

1個: http://docs.sqlalchemy.org
2: https://www.python.org/dev/peps/pep-0249/

例子

創建一個內存中的SQLite數據庫。

from sqlalchemy import create_engine
engine = create_engine('sqlite://', echo=False)

從頭開始創建帶有3行的表。

df = pd.DataFrame({'name' : ['User 1', 'User 2', 'User 3']})
print(df)
     name
0  User 1
1  User 2
2  User 3

df.to_sql('users', con=engine)
engine.execute("SELECT * FROM users").fetchall()
[(0, 'User 1'), (1, 'User 2'), (2, 'User 3')]
df1 = pd.DataFrame({'name' : ['User 4', 'User 5']})
df1.to_sql('users', con=engine, if_exists='append')
engine.execute("SELECT * FROM users").fetchall()
[(0, 'User 1'), (1, 'User 2'), (2, 'User 3'),
 (0, 'User 4'), (1, 'User 5')]

用Just覆蓋表df1。

 
               df1.to_sql('users', con=engine, if_exists='replace',
           index_label='id')
engine.execute("SELECT * FROM users").fetchall()
[(0, 'User 4'), (1, 'User 5')] 
              

指定dtype（特別適用於缺少值的整數）。請注意，雖然熊貓被迫將數據存儲為浮點數，但數據庫支持可為空的整數。使用Python提取數據時，我們會返回整數標量。

df = pd.DataFrame({"A": [1, None, 2]})
df
     A
0  1.0
1  NaN
2  2.0
from sqlalchemy.types import Integer
df.to_sql('integers', con=engine, index=False,
          dtype={"A": Integer()})
engine.execute("SELECT * FROM integers").fetchall()
[(1,), (None,), (2,)]

engine = create_engine('mysql+pymysql://admin:111111@172.16.13.119:3306/jt')
            engine.execute('DROP TABLE if exists jira_report_01')
            engine.execute('CREATE TABLE jira_report_01 LIKE jira_report;')
            df_r_t_data.to_sql('jira_report_01', con=engine, if_exists='append', index=True, index_label='CycleName')

            engine = create_engine('mysql+pymysql://admin:111111@172.16.13.119:3306/jt')
            dfReport = pd.read_sql_table(table_name='jira_report_01', con=engine, columns=['CycleName','通過', '失敗', '未執行', '阻止', '不適用'])
            DataHtml = pd.DataFrame.to_html(dfReport)

            encoding_type = self.get_encoding_type('/Users/cloud/7_3/JIRA_REST_API/jira_data/email_template.html')
            tags_stats = {"project_name": self.project_name,
                          "project_version": self.project_version,
                          "test_date": datetime.date.today(),
                          "result_body": DataHtml,
                          "new_defects_added_today": self.new_defects_added_today,
                          "current_version_reference_defect": self.current_version_reference_defect
                          }

            template_dic = {"test_stat": tags_stats}
            templates_path = os.path.abspath('..') + os.sep + 'templates/'

            env = jinja2.Environment(
                loader=jinja2.FileSystemLoader(templates_path,encoding=encoding_type)
            )
            template = env.get_template('email_template.html')
            send_mail_template = template.render(template_dic)
            email_canvas = send_mail_template
            self.email_status = self.email_static_execution_distribution('2285989001@qq.com', '【{}】【{}】【{}】自動化測試情況'.format(self.project_name, self.project_version, datetime.date.today()), email_canvas)
            return self.email_status

JIRA 循環獲取接口參數

log_prefix = "{}   executions_status_count_for_cycle_by_projectId_and_version:".format(self.tag)
            print(log_prefix)
            self.project_name = project_name
            self.project_version = project_version
            self.tester_email = tester_email
            jira = JIRA(server=self.base_url, basic_auth=(self.jira_user, self.jira_password))
            projects = jira.projects()
            if isinstance(self.project_name, str) and isinstance(self.project_version,str):
                for i in range(len(projects)):
                    if str(projects).__contains__(self.project_name) and projects[i].key == self.project_name:
                        project_id = projects[i].id
                        print('HARI3.0 Platform 項目ID是 : ', project_id)
                        print('version \n', jira.project(project_id).versions)
                        print(len(jira.project(project_id).versions))
                        for j in range(len(jira.project(project_id).versions)):
                            if str(jira.project(project_id).versions).__contains__(self.project_version) and jira.project(project_id).versions[j].name == self.project_version:
                                version_id = jira.project(project_id).versions[j].id
                                print('項目version編號ID是 \n', version_id)
                                url = '/rest/zephyr/latest/execution/executionsStatusCountForCycleByProjectIdAndVersion?projectId={}&versionId={}&components=&_={}'.format(
                                    project_id, version_id, int(round(time.time() * 1000)))
                                r = self.session.get(self.base_url + url, headers=self.jira_headers, verify=False)
                                print('\njira返回值\n', r.text)
                                if r.status_code == 200:
                                    print("\n獲取JIRA列表成功: {} ".format(r.text))
                                    result_json = r.json()
                                    new_dict = {k.split(':')[0]: v for k, v in result_json.items()}
                                    print(new_dict)
                                    self.email_status =self.export_excel(new_dict)
                                    return self.email_status

                        else:
                            self.email_status = ['FAIL','郵件發送失敗,回調信息 project_version 錯誤或者不存在！\n當前的版本是{}'.format(jira.project(project_id).versions)]
                            return self.email_status
                else:
                    self.email_status = ['FAIL','郵件發送失敗,回調信息 JIRA 項目名稱 project_name 錯誤！\n{}'.format(str(projects))]
                    return self.email_status

    def sql_issue_excel(self, table_name, jql):
        print('PASS')
        self.write_to_excel('Sprints', jql)
        search_list = self.search_list_sprints[0]
        print(search_list)
        print(type(search_list))
        search_data = pd.DataFrame(search_list)
        search_data_dict = search_data.to_dict()
        print('current search_data \n', search_data)
        print(type(search_data_dict))
        print(len(search_data_dict))
        if isinstance(search_data_dict, dict):
            search_data_dict["Issue"] = search_data_dict.pop(0)
            search_data_dict["Created"] = search_data_dict.pop(1)
            search_data_dict["Issue Type"] = search_data_dict.pop(2)
            search_data_dict["Summary"] = search_data_dict.pop(3)
            search_data_dict["Status"] = search_data_dict.pop(4)
            search_data_dict["Severity"] = search_data_dict.pop(5)
            search_data_dict["Priority"] = search_data_dict.pop(6)
            search_data_dict["Reporter"] = search_data_dict.pop(7)
            search_data_dict["Assignee"] = search_data_dict.pop(8)
            search_data_dict["URL"] = search_data_dict.pop(9)
            print(len(search_data_dict))
            print(search_data_dict)
            search_data = search_data_dict
        search_data_pd = pd.DataFrame(search_data)
        print('current \n', search_data_pd)

        dtypedict = {
            'Issue': NVARCHAR(length=255),
            'Created': DATE,
            'Issue Type': NVARCHAR(length=255),
            'Summary': NVARCHAR(length=255),
            'Status': NVARCHAR(length=255),
            'Severity': NVARCHAR(length=255),
            'Priority': NVARCHAR(length=255),
            'Reporter': NVARCHAR(length=255),
            'Assignee': NVARCHAR(length=255),
            'URL': NVARCHAR(length=255)
        }
        engine = create_engine('mysql+pymysql://admin:111111@172.16.13.119:3306/jt')
        engine.execute('DROP TABLE if exists {}'.format(table_name))
        # engine.execute('CREATE TABLE search_issues LIKE search_issues_template;')
        search_data_pd.to_sql(table_name, con=engine, if_exists='append', index=False, dtype=dtypedict)
        df_search_issues = pd.read_sql_table(table_name=table_name, con=engine, columns=['Issue', 'Created', 'Issue Type', 'Summary', 'Status', 'Severity', 'Priority', 'Reporter', 'Assignee', 'URL'])
        return pd.DataFrame.to_html(df_search_issues)

    def export_excel(self, export):
        try:
            jql_new_defects_added_today = ['''project = RDK AND issuetype = 缺陷 AND status in (Resolved, Investigating, Rejected, Duplicated, Monitor, New, Reopen, Analysing, integrated) AND affectedVersion = V0.6 AND created >= -1d AND created <= 1d ORDER BY created DESC, status DESC, summary ASC, key ASC, priority DESC, updated DESC''']

            jql_current_version_reference_defect = ['''project = RDK AND issuetype = 缺陷 AND status in (Resolved, Investigating, Rejected, Duplicated, Monitor, New, Reopen, Analysing, integrated) AND affectedVersion = V0.6 AND created >= -7d AND created <= 7d ORDER BY created DESC, status DESC, summary ASC, key ASC, priority DESC, updated DESC''']
            self.sql_issue_excel('new_defects_added_today',jql_new_defects_added_today)
            self.current_version_reference_defect = self.sql_issue_excel('current_version_reference_defect', jql_current_version_reference_defect)
            df_r_t_data = pd.DataFrame(export)
            df_r_t_data = df_r_t_data.T
            engine = create_engine('mysql+pymysql://admin:111111@172.16.13.119:3306/jt')
            engine.execute('DROP TABLE if exists jira_report_01')
            engine.execute('CREATE TABLE jira_report_01 LIKE jira_report;')
            df_r_t_data.to_sql('jira_report_01', con=engine, if_exists='append', index=True, index_label='CycleName')

            engine = create_engine('mysql+pymysql://admin:111111@172.16.13.119:3306/jt')
            dfReport = pd.read_sql_table(table_name='jira_report_01', con=engine, columns=['CycleName','通過', '失敗', '未執行', '阻止', '不適用'])
            DataHtml = pd.DataFrame.to_html(dfReport)

            encoding_type = self.get_encoding_type('/Users/cloud/7_3/JIRA_REST_API/jira_data/email_template.html')
            tags_stats = {"project_name": self.project_name,
                          "project_version": self.project_version,
                          "test_date": datetime.date.today(),
                          "result_body": DataHtml,
                          "new_defects_added_today": self.new_defects_added_today,
                          "current_version_reference_defect": self.current_version_reference_defect
                          }

            template_dic = {"test_stat": tags_stats}
            templates_path = os.path.abspath('..') + os.sep + 'templates/'

            env = jinja2.Environment(
                loader=jinja2.FileSystemLoader(templates_path,encoding=encoding_type)
            )
            template = env.get_template('email_template.html')
            send_mail_template = template.render(template_dic)
            email_canvas = send_mail_template
            self.email_status = self.email_static_execution_distribution('2285989001@qq.com', '【{}】【{}】【{}】SIT測試情況'.format(self.project_name, self.project_version, datetime.date.today()), email_canvas)
            return self.email_status
        except Exception as e:
            self.email_status = ['FAIL','郵件發送失敗,回調信息{}'.format(e)]
            return self.email_status

            workbook = xlsxwriter.Workbook(jira_current_issue_list_file)
            bold = workbook.add_format({'bold': True})
            row = 0
            col = 0
            value = 0
            print("Attempting to create data tables for: {}".format(modules))
            modules = modules.split()
            # 為不同類型的數據創建單獨的工作表
            for x in modules:
                print("\nSearching: {}".format(x.upper()))
                # 為之前創建的2個模塊中的每個模塊創建特定格式
                if x.lower() == 'sprints':
                    search_list = self.jira_search(jql)
                    value = 0
                    row = 0
                    col = 0
                    worksheet = workbook.add_worksheet('Sprints')
                    self.search_list_sprints = self.search_for_search_list(jql)
                    for x in range(len(self.search_list_sprints)):
                        search_amount_sprints = len(self.search_list_sprints[value]) + 2
                        worksheet.write(row, 0, search_list[x], bold)
                        worksheet.add_table(row + 1, 0, row + search_amount_sprints, 11, {'data': self.search_list_sprints[value],
                                                                                          'style': 'Table Style Medium 2',
                                                                                          'columns': [{'header': 'Issue'},
                                                                                                      {'header': 'Created'},
                                                                                                      {'header': 'Issue Type'},
                                                                                                      {'header': 'Summary'},
                                                                                                      {'header': 'Status'},
                                                                                                      {'header': 'Severity'},
                                                                                                      {'header': 'Priority'},
                                                                                                      {'header': 'Reporter'},
                                                                                                      {'header': 'Assignee'},
                                                                                                      {'header': 'URL'}]})
                        format2 = workbook.add_format({'num_format': 'mm/dd/yy'})
                        # Little column formatting
                        worksheet.set_column('A:A', 15)
                        worksheet.set_column('B:B', 10, format2)
                        worksheet.set_column('C:C', 5)
                        worksheet.set_column('D:D', 5)
                        worksheet.set_column('E:E', 12)
                        worksheet.set_column('F:F', 20)
                        row += search_amount_sprints + 1
                        value += 1
            else:
                print('There are no more values to add')
            workbook.close()
        except Exception as e:
            print(e)
            return e

    def sql_issue_excel(self, table_name, jql):
        print('PASS')
        if not self.new_defects_added_today and isinstance(jql, list) and not self.current_version_reference_defect:
            print('當前執行的是【今天新增缺陷】{} new_defects_added_today'.format(jql))
            self.write_to_excel('Sprints', jql)
        if not self.current_version_reference_defect and isinstance(jql, list) and self.new_defects_added_today:
            print('當前執行的是【當前版本引用缺陷】{} current_version_reference_defect'.format(jql))
            self.write_to_excel('Sprints', jql)
        search_list = self.search_list_sprints[0]
        print(search_list)
        print(type(search_list))
        search_data = pd.DataFrame(search_list)
        search_data_dict = search_data.to_dict()
        print('current search_data \n', search_data)
        print(type(search_data_dict))
        print(len(search_data_dict))
        if isinstance(search_data_dict, dict) and len((search_data_dict)) != 0:
            search_data_dict["Issue"] = search_data_dict.pop(0)
            search_data_dict["Created"] = search_data_dict.pop(1)
            search_data_dict["Issue Type"] = search_data_dict.pop(2)
            search_data_dict["Summary"] = search_data_dict.pop(3)
            search_data_dict["Status"] = search_data_dict.pop(4)
            search_data_dict["Severity"] = search_data_dict.pop(5)
            search_data_dict["Priority"] = search_data_dict.pop(6)
            search_data_dict["Reporter"] = search_data_dict.pop(7)
            search_data_dict["Assignee"] = search_data_dict.pop(8)
            search_data_dict["URL"] = search_data_dict.pop(9)
            print(len(search_data_dict))
            print(search_data_dict)
            search_data = search_data_dict

            search_data_pd = pd.DataFrame(search_data)
            print('current \n', search_data_pd)
            dtypedict = {
                'Issue': NVARCHAR(length=255),
                'Created': DATE,
                'Issue Type': NVARCHAR(length=255),
                'Summary': NVARCHAR(length=255),
                'Status': NVARCHAR(length=255),
                'Severity': NVARCHAR(length=255),
                'Priority': NVARCHAR(length=255),
                'Reporter': NVARCHAR(length=255),
                'Assignee': NVARCHAR(length=255),
                'URL': NVARCHAR(length=255)
            }
            engine = create_engine('mysql+pymysql://admin:111111@172.16.13.119:3306/jt')
            engine.execute('DROP TABLE if exists {}'.format(table_name))
            # engine.execute('CREATE TABLE search_issues LIKE search_issues_template;')
            search_data_pd.to_sql(table_name, con=engine, if_exists='append', index=False, dtype=dtypedict)
            df_search_issues = pd.read_sql_table(table_name=table_name, con=engine,columns=['Issue', 'Created', 'Issue Type', 'Summary', 'Status', 'Severity', 'Priority', 'Reporter', 'Assignee', 'URL'])
            return pd.DataFrame.to_html(df_search_issues)
        elif len((search_data_dict)) == 0:
            return print('當前查詢數據返回空值')

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python Pandas pandas.DataFrame.to_sql函數方法的使用使用 pyodbc 將數據從Pandas的DataFrame寫入SQL Server python pandas dataframe to_sql方法error及其解決 pandas DataFrame(5)-合並DataFrame與Series Pandas dataframe 和 spark dataframe 轉換 pandas 替換dataframe表頭 pandas入門之DataFrame 如何加速pandas的DataFrame Pandas之DataFrame基本操作 pandas.DataFrame.to_csv