linux定時任務及文件操作

本文轉載自查看原文 2020-07-06 18:08 1078

查看定時任務

crontab -l

注冊定時任務

crontab -e
然后就像 vim 一樣編輯自己的定時任務。
如：
* * * * * . /home/hadoop/timer/check_job.sh >> /home/hadoop/timer/logs/check_job.log

定時任務解析

*和*之間的空格，是必須的
*分別代表：分，時，日，月，周
1. 分 的取值范圍為：0-59
2. 時 的取值范圍為：0-23
3. 日 的取值范圍為：1-31
4. 月 的取值范圍為：1-12
5. 周 的取值范圍為：0-7 
*后面是需要執行的命令

"." 代表是shell 命令，也可以使用 sh

">>" 前面的是需要定時調用的shell，后面是需要輸出的 log 文件的位置

實例

1. * * * * * 代表每分鍾執行一次，也可以寫成 */1 * * * *，/1代表一分鍾執行一次
2. 30 */1 * * * 代表每小時的 30 分執行一次

以下是對文件的操作

根據文件名稱取得最大日期對文件

文件名稱的格式為：filter_cache_20171101.se

max_date=0 # get the latest file and copy to hdfs cd /home/hadoop/.../checkpoint/filter for dir in $(ls -l ./ | awk '/^d/{print $NF}') do if [[ -d $dir && $dir == *\_* ]]; then f_d=$(echo $dir | cut -d \_ -f 3 | cut -d \. -f 1) if [[ $max_date < $f_d ]]; then max_date=$f_d max_filter=$dir fi fi done echo " max date is : "$max_date echo " max filter is : "$max_filter

復制最近日期對文件到hdfs

如果文件存在，提示已經存在

hadoop fs -test -e /data/.../bloom_filters/$max_filter
if [[ $? == 0 ]]; then echo " filter is already exist : "$max_filterF else echo " start hdfs copy " hadoop fs -put $max_filter /data/.../bloom_filters fi

設定需要刪除過期文件的指定時間

remove_week=$(date -d "$max_date 7 days ago" +%Y%m%d) echo " 刪除本地序列化文件的日期界限："$remove_week remove_date=$(date -d "$max_date 30 days ago" +%Y%m%d) echo " 刪除文件 和 Hadoop filter 的日期界限："$remove_date

刪除指定日期30天以外的本地文件，並且刪除小於指定日期7天以外的指定文件夾的文件

for r_dir in $(ls -l ./ | awk '/^d/{print $NF}') do if [[ -d $r_dir && $r_dir == *\_* ]]; then r_d=$(echo $r_dir | cut -d \_ -f 3 | cut -d \. -f 1) if [[ $r_d < $remove_date ]]; then echo " remove filter_dir is: "$r_dir rm -r $r_dir elif [[ $r_d < $remove_week ]]; then echo " remove filter is: "$r_dir rm -r $r_dir/*.FILTER.SER fi fi done

刪除hdfs上指定日期30以外的文件

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Linux | 定時任務 Linux 定時任務 Linux定時任務 Linux定時任務 linux定時任務 linux 定時任務 Linux之定時任務 linux之定時任務 linux定時任務 - at定時任務 linux(centOS7)的基本操作(四) 定時任務——crontab