【報錯】解決logstash tracking_column not found in dataset. {:tracking_column=>"updated_time"}問題

本文轉載自查看原文 2019-10-13 00:07 787 logstash

　　今天用logstash同步數據庫記錄到elasticsearch時候出現錯誤，錯誤信息如下：

[2019-10-12T23:51:00,529][WARN ][logstash.inputs.jdbc     ] tracking_column not found in dataset. {:tracking_column=>"updated_time"}
{ 2018 rufus-scheduler intercepted an error:
  2018   job:
  2018     Rufus::Scheduler::CronJob "* * * * *" {}
  2018   error:
  2018     2018
  2018     TypeError
  2018     can't dup NilClass
  2018       org/jruby/RubyKernel.java:1882:in `dup'
  2018       uri:classloader:/META-INF/jruby.home/lib/ruby/stdlib/date/format.rb:838:in `_parse'
  2018       uri:classloader:/META-INF/jruby.home/lib/ruby/stdlib/date.rb:1830:in `parse'
  2018       /usr/local/logstash-6.4.3/vendor/bundle/jruby/2.3.0/gems/logstash-input-jdbc-4.3.13/lib/logstash/plugin_mixins/jdbc/value_tracking.rb:87:in `set_value'
  2018       /usr/local/logstash-6.4.3/vendor/bundle/jruby/2.3.0/gems/logstash-input-jdbc-4.3.13/lib/logstash/plugin_mixins/jdbc/jdbc.rb:237:in `execute_statement'
  2018       /usr/local/logstash-6.4.3/vendor/bundle/jruby/2.3.0/gems/logstash-input-jdbc-4.3.13/lib/logstash/inputs/jdbc.rb:277:in `execute_query'
  2018       /usr/local/logstash-6.4.3/vendor/bundle/jruby/2.3.0/gems/logstash-input-jdbc-4.3.13/lib/logstash/inputs/jdbc.rb:258:in `block in run'
  2018       /usr/local/logstash-6.4.3/vendor/bundle/jruby/2.3.0/gems/rufus-scheduler-3.0.9/lib/rufus/scheduler/jobs.rb:234:in `do_call'
  2018       /usr/local/logstash-6.4.3/vendor/bundle/jruby/2.3.0/gems/rufus-scheduler-3.0.9/lib/rufus/scheduler/jobs.rb:258:in `do_trigger'
  2018       /usr/local/logstash-6.4.3/vendor/bundle/jruby/2.3.0/gems/rufus-scheduler-3.0.9/lib/rufus/scheduler/jobs.rb:300:in `block in start_work_thread'
  2018       /usr/local/logstash-6.4.3/vendor/bundle/jruby/2.3.0/gems/rufus-scheduler-3.0.9/lib/rufus/scheduler/jobs.rb:299:in `block in start_work_thread'
  2018       org/jruby/RubyKernel.java:1292:in `loop'
  2018       /usr/local/logstash-6.4.3/vendor/bundle/jruby/2.3.0/gems/rufus-scheduler-3.0.9/lib/rufus/scheduler/jobs.rb:289:in `block in start_work_thread'
  2018   tz:
  2018     ENV['TZ']: 
  2018     Time.now: 2019-10-12 23:51:00 +0800
  2018   scheduler:
  2018     object_id: 2008
  2018     opts:
  2018       {:max_work_threads=>1}
  2018       frequency: 0.3
  2018       scheduler_lock: #<Rufus::Scheduler::NullLock:0x5f5e76bc>
  2018       trigger_lock: #<Rufus::Scheduler::NullLock:0x707e50a2>
  2018     uptime: 242.19924699999999 (4m2s199)
  2018     down?: false
  2018     threads: 2
  2018       thread: #<Thread:0x76e69139>
  2018       thread_key: rufus_scheduler_2008
  2018       work_threads: 1
  2018         active: 1
  2018         vacant: 0
  2018         max_work_threads: 1
  2018       mutexes: {}
  2018     jobs: 1
  2018       at_jobs: 0
  2018       in_jobs: 0
  2018       every_jobs: 0
  2018       interval_jobs: 0
  2018       cron_jobs: 1
  2018     running_jobs: 1
  2018     work_queue: 0

這種錯誤會導致創建不了時間節點文件。

問題原因是由於我的conf 中sql是多表聯查的，我給每個字段起了別名（駝峰方式），但是logstash里面不支持駝峰字段，所以將字段別名全部用了小寫，之后就好了，以下附上本人的conf文件

input {
  jdbc {
    jdbc_driver_library => "/usr/local/sql/mysql-connector-java-5.1.46.jar"
    jdbc_driver_class => "com.mysql.jdbc.Driver"
    jdbc_connection_string => "jdbc:mysql://XXXX/test"
    jdbc_user => "xxxx"
    jdbc_password => "xxxx"
    schedule => "* * * * *"
    statement => "SELECT p.product_id productid, p. NAME, p.title, p.description, pc.product_category_name productCategoryName, pc.product_category_describe productCategoryDescribe, ppc.price_category_name priceCategoryName, ppc.price_category_describe priceCategoryDescribe, pp.price, p.created_by createdBy, p.created_time createdTime, p.updated_by updatedBy, p.updated_time updatedtime FROM product p LEFT JOIN product_price pp ON p.product_id = pp.product_id LEFT JOIN product_category pc ON p.category_id = pc.product_category_id LEFT JOIN product_price_category ppc ON pp.price_category_id = ppc.price_category_id WHERE p.updated_time >= :sql_last_value"
    use_column_value => true
    tracking_column_type => "timestamp"
    tracking_column => "updatedtime"
    last_run_metadata_path => "syncpoint_product"
  }
}


output {
    elasticsearch {
        # ES的IP地址及端口
        hosts => ["172.31.70.140:9200","172.31.70.140:9201"]
        # 索引名稱 可自定義
        index => "product"
        # 需要關聯的數據庫中有有一個id字段，對應類型中的id
        document_id => "%{productid}"
        document_type => "product"
    }
    stdout {
        # JSON格式輸出
        codec => json_lines
    }
}

本次整理希望能幫助大家。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Staple: Complementary Learners For Real-time Tracking Tracking Spark 2.0 DataFrame map操作中Unable to find encoder for type stored in a Dataset.問題的分析與解決 Matlab Script to pre-process UAV123 tracking dataset 論文筆記：Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy Visual Tracking git pull報錯:There is no tracking information for the current branch @Column Transformer Tracking [Object Tracking] Overview of Object Tracking ‘Skimming-Perusal’ Tracking: A Framework for Real-Time and Robust Long-term Tracking "There is no tracking information for the current branch" 解決方法