wget -i index.html -F -B -c https://www.lmd.de/downloads
mwget
https://blog.csdn.net/b114213903/article/details/108223258
https://www.cnblogs.com/lingwang3/p/14121773.html
https://blog.csdn.net/hbuxiaofei/article/details/109011546
https://blog.csdn.net/dghggij/article/details/83654577 简介
乱码解决
https://blog.51cto.com/kusorz/1943234
curl示例:
curl http://www.example.com/123.txt|iconv -f gb2312 -c
-c 忽略无效字符
wget示例:
wget --restrict-file-names=nocontrol http://www.example.com/123.txt
下载页面以及页面 下链接,
适用于 目录类型 页面 带很多其他文件需要下载
wget -F -B -c -r -np -k -L -p www.iro.umontreal.ca/~panneton/well/
缺少-F -B
先介绍几个参数:-c 断点续传(备注:使用断点续传要求服务器支持断点续传),-r 递归下载(目录下的所有文件,包括子目录),-np 递归下载不搜索上层目录,-k 把绝对链接转为相对链接,这样下载之后的网页方便浏览。-L 递归时不进入其他主机,-p 下载网页所需要的所有文件。
比如:
wget -c -r -np -k -L -p http://www.predictioncenter.org/download_area/CASP10/server_predictions/
缺少-F -B
wget下载一个页面以及所需的所有文件(包括嵌入的js,css等)
wget -E -H -k -K -p http://jsonviewer.stack.hu
加载下载好的页面 根据地址下载 页面的链接
wget http://mirrors.aliyun.com/centos/7.6.1810/cloud/x86_64/openstack-rocky/
wget -i index.html -F -B http://mirrors.aliyun.com/centos/7.6.1810/cloud/x86_64/openstack-rocky/
如何在Windows下为wget设置http代理地址?
如果没有参数运行我的wget打印:
D:\>wget
SYSTEM_WGETRC = c:/progra~1/wget/etc/wgetrc
syswgetrc = c:/progra~1/wget/etc/wgetrc
D:\Apps\Util\wget: missing URL
Usage: D:\Apps\Util\wget [OPTION]... [URL]...
Try `D:\Apps\Util\wget --help' for more options.
这可能意味着,就是找文件wgetrc在c:/progra~1/wget/etc/wgetrc。不幸的是,该位置不适用于非root用户程序。我以为我可以修改SYSTEM_WGETRC或syswgetrc环境变量,但这看起来没有效果
D:\>echo %SYSTEM_WGETRC%
d:\apps\util\wgetrc
D:\>echo %syswgetrc%
D:\APPS\Util\wgetrc
wget --help没有告诉你太多。有关更多详细信息,您可以查看在线wget手册 或 man wget (它们是不同的东西,通常每个都值得检查)
简而言之,这是一个例子
C:\sdf>wget -e http_proxy=127.0.0.1:8118 www.google.com
还有一个
C:\sdf>set http_proxy=127.0.0.1:8118
C:\sdf>wget www.google.com
该手册提到了wgetrc命令。您会在此处看到有关http代理的一些信息。
6.3 Wgetrc命令
http_proxy = string
使用字符串作为http代理,而不是环境中指定的字符串。
https_proxy = string
使用字符串作为https代理,而不是环境中指定的字符串。
8.1代理
Wget支持HTTP和ftp检索的代理。Wget可以识别的指定代理位置的标准方法是使用以下环境变量:
http_proxy
https_proxy
如果设置,则http_proxy和https_proxy变量应分别包含http和https连接的代理的URL。
添加
关于wget手册页和“ wget手册”。
命令行上的手册页是最新的,但是手册(与手册页不同的实体)并不总是最新的wget版本。截至撰写时(2015年9月)。http://www.gnu.org/software/wget/manual/wget.html 您可以在顶部看到该版本,并检查它是否为最新的 http://ftp.gnu.org/gnu/wget/, 其中显示了日期太。(您在archive.org上看到,例如,在2013年11月,gnu手册已过时。在2013年11月,甚至在2014年3月,他们仍显示wget 1.13.4,该数据来自2011年)
对于联机帮助页,如果要从命令行检查,则它必须是您使用的版本,因此只需确保命令为最新/更新它,就可以了。您可能要检查您正在使用的在线资源是否正在显示最新的手册页。这其中似乎罚款https://www.kernel.org/doc/man-pages/ 链接http://man7.org/linux/man-pages/man1/wget.1.html 您还可以检查其版本有针对ftp链接以确保它是最新版本。
在dos / windows命令行或批处理文件中,您可以指定
set http[s]_proxy=http[s]://proxyserver:port/
Linux中为wget命令设置代理
方法1:使用命令参数-e
wget本身没有专门设置代理的命令行参数,但是有一个"-e"参数,可以在命令行上指定一个原本出现在".wgetrc"中的设置。于是可以变相在命令行上指定代理:-e, --execute=COMMAND 执行`.wgetrc'格式的命令
例如:wget -c -r -np -k -L -p -e "http_proxy=http://127.0.0.1:8087" http://www.subversion.org.cn/svnbook/1.4/
这种方式对于使用一个临时代理尤为方便。
注: 如果是https,则参数为:-e "https_proxy=http://127.0.0.1:8087"
使用https时如果想要忽略服务器端证书的校验,可以使用 -k 参数。
方法2:在环境变量中设置代理
export http_proxy=http://127.0.0.1:8087
方法3:使用配置文件
为wget使用代理,可以直接修改/etc/wgetrc,也可以在主文件夹下新建.wgetrc,并编辑相应内容,本文采用后者。
将/etc/wgetrc中与proxy有关的几行复制到~/.wgetrc,并做如下修改:
#You can set the default proxies for Wget to use for http, https, and ftp.
# They will override the value in the environment.
https_proxy = http://127.0.0.1:8087/
http_proxy = http://127.0.0.1:8087/
ftp_proxy = http://127.0.0.1:8087/
# If you do not want to use proxy at all, set this to off.
use_proxy = on
这里 use_proxy = on 开启了代理,如果不想使用代理,每次都修改此文件未免麻烦,我们可以在命令中使用-Y参数来临时设置:-Y, --proxy=on/off 打开或关闭代理
wget和curl中使用代理
命令使用代理
wget/curl 都支持使用代理
wget -e “http_proxy=10.1.4.43:8080″ proxy.mimvp.com
curl -x 10.1.4.43:8080 proxy.mimvp.com
环境变量使用代理
curl、wget也支持通过环境变量http_proxy来设置要使用的代理服务器, 如下:
# 这个帐号使用的代理服务器
http_proxy=”http://mycache.mydomain.com:3128″
export http_proxy
如果代理服务器需要用户名和密码,只要将它们加入 URL。
例如:用户名 myuser,密码 mypwd,添加设定:
# 这个帐号使用的代理服务器和用户名/密码
http_proxy=”http://myuser:mypwd@mycache.mydomain.com:3128″
export http_proxy
然后直接wget proxy. .com 或者curl proxy. .com, 就是通过代理来访问
WGET 通过代理下载文件
wget -e "http_proxy=http://root:123456@127.0.0.1:8080" http://www.163.com/download/test.zip
wget -e "http_代理服务器=http协议://账号:密码@IP:端口号" 下载资源的链接