-
Java 多线程爬虫及分布式爬虫架构探索
所属栏目:[优化] 日期:2019-10-20 热度:172
这是 Java 爬虫系列博文的第五篇,在上一篇 Java 爬虫服务器被屏蔽,不要慌,咱们换一台服务器 中,我们简单的聊反爬虫策略和反反爬虫方法,主要针对的是 IP 被封及其对应办法。前面几篇文章我们把爬虫相关的基本知识都讲的差不多啦。这一篇我们来聊一聊爬[详细]
-
九个对Web开发者最有用的Python包,掌握这些,工资至少能涨涨
所属栏目:[优化] 日期:2019-10-20 热度:84
1、Matplotlib Matplotlib,正如其名称所暗示的那样,是一个用来绘制数学函数和模型的库;扩展了Numpy的作用,Matplotlib可以只用几行代码来创建图,条形图,散点图等诸多视觉表现。 2、BeautifulSoup4 BeautifulSoup4是go-to包,如果你为某些元素去解析HTM[详细]
-
详解Java锁机制:看完你就明白的锁系列之锁的状态
所属栏目:[优化] 日期:2019-10-20 热度:115
看完你就会知道,线程如果锁住了某个资源,致使其他线程无法访问的这种锁被称为悲观锁,相反,线程不锁住资源的锁被称为乐观锁,而自旋锁是基于 CAS 机制实现的,CAS又是乐观锁的一种实现,那么对于锁来说,多个线程同步访问某个资源的流程细节是否一样呢?[详细]
-
揭秘Kafka的高性能吞吐
所属栏目:[优化] 日期:2019-10-20 热度:72
Kafka作为时下开源消息系统,被广泛地应用在数据缓冲、异步通信、汇集日志、系统解耦等方面。相比较于RocketMQ等其他常见消息系统,Kafka在保障了大部分功能特性的同时,还提供了读写性能。 本文将针对Kafka性能方面进行简单分析,首先简单介绍一下Kafka的[详细]
-
如何使Pandas来加速你的代码?
所属栏目:[优化] 日期:2019-10-20 热度:154
Pandas对数据科学界来说是一份天赐的礼物。问任何一个数据科学家,他们喜欢如何使用Python处理他们的数据集,他们无疑会谈到Pandas。 Pandas是一个伟大的编程库的缩影:简单、直观、功能广泛。 然而,对数据科学家的一项常规任务,使用Pandas进行数千甚至[详细]
-
Go语言的中的For循环之大坑
所属栏目:[优化] 日期:2019-10-20 热度:171
For循环在我们日常编码中可能用的很多。在很多业务场景中我们都需要用for循环处理。但golang中的for循环有一个大大大的坑,大家可否遇到。直接上代码: 我们写一个测试类,定义一个切片数组,然后循环迭代每个元素,将元素的值放到另一个切片。循环finalAr[详细]
-
要不要赶个时髦,去建设一个「 中台 」?
所属栏目:[优化] 日期:2019-10-20 热度:167
很多技术人总是抱怨 新技术/新框架/新概念 太多了,总是学不完,抱怨实在是学不动了。哈哈,这不,最近「 中台 」这么火热,要不要停止抱怨,再咬咬牙学一波? 很多人都担心被技术新潮流所抛弃,所以当遇见不断涌现的新技术时,总是慌忙的去学习。可是其中[详细]
-
代码写成这样,老夫无可奈何!
所属栏目:[优化] 日期:2019-10-20 热度:109
你见过最无可奈何的代码是什么?今天,栈长就来总结一下我遇到过的一些神逻辑代码,不一定很全,但我真心写不出,真心让我自叹不如啊! 1、耍猴的好手段 还记得 XX 手机的抢购活动么,抢购按钮的代码类似是这样的: ahref=javasript:alert('抢购结束!')立即[详细]
-
18个Python脚本可加速你的编码速度
所属栏目:[优化] 日期:2019-10-20 热度:154
在本文中,我们向您介绍一些提示和技巧,以帮助您更快地编写代码 Python的可读性和设计简单性是其广受欢迎的两个主要原因。 一些常见的Python技巧可以帮助你提高编码速度。在您的日常编码练习中,以下技巧将非常有用。 1.在字符串中查找唯一元素 以下代码[详细]
-
Kubernetes节点之间的ping监控
所属栏目:[优化] 日期:2019-10-19 热度:144
在诊断Kubernetes集群问题的时候,我们经常注意到集群中某一节点在闪烁*,而这通常是随机的且以奇怪的方式发生。这就是为什么我们一直需要一种工具,它可以测试一个节点与另一个节点之间的可达性,并以Prometheus度量形式呈现结果。有了这个工具,我们还希[详细]
-
网络爬虫程序员被抓,我们还敢爬虫吗?细数那些Java爬虫技术
所属栏目:[优化] 日期:2019-10-19 热度:173
最近,某大数据科技公司因为涉嫌非法抓取某招聘网站用户的简历信息,公司被查封,负责编写抓取程序的程序员也将面临坐牢。 事情的大概经过是这样的: 某大数据科技公司老板丢给一个小小的程序员一个网站,告诉他把这个网站的数据抓取下来,咱们做一做分析[详细]
-
数据科学中一些不常用但很有用的Python库
所属栏目:[优化] 日期:2019-10-19 热度:109
导读 提到数据科学的python包,大家想到的估计是numpy,pandas,scikit-learn之类的,这里给大家介绍一些不常用,但是非常有用的python包,就像是痒痒挠,虽然大部分时间用不上,但是真要用起来,还是挺爽的。 Python是个了不起的语言。事实上,这是世界上[详细]
-
架构师知识储备——深入理解BIO、NIO、AIO
所属栏目:[优化] 日期:2019-10-19 热度:90
本文你将获取到:同/异步 + 阻/非阻塞的性能区别;BIO、NIO、AIO 的区别;理解和实现 NIO 操作 Socket 时的多路复用;同时掌握 IO 最底层最核心的操作技巧。 BIO、NIO、AIO 的区别是什么? 同/异步、阻/非阻塞的区别是什么? 文件读写最优雅的实现方式是什么? N[详细]
-
久等了,提高开发效率的Vue 技巧来了
所属栏目:[优化] 日期:2019-10-19 热度:127
最近俩月正好用 vue 做了一个大数据的项目,积累了很多心得。今天终于有机会分享出来了。 组件(component)的使用 vue 提供的模块化无疑是提高开发效率的神器,而且对于后期代码优化和维护也提供的极大地便利。 组件使用简介 vue 提供了组件功能,组件又可[详细]
-
一文搞懂如何在Spring Boot正确中使用JPA
所属栏目:[优化] 日期:2019-10-19 热度:162
JPA 这部分内容上手很容易,但是涉及到的东西还是挺多的,网上大部分关于 JPA 的资料都不是特别齐全,大部分用的版本也是比较落后的。另外,我下面讲到了的内容也不可能涵盖所有 JPA 相关内容,我只是把自己觉得比较重要的知识点总结在了下面。很多地方我[详细]
-
开发十年面试过1000个人,总结出这份高薪Java 试秘诀
所属栏目:[优化] 日期:2019-10-19 热度:173
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 目录: 框架是重点,但别让人感觉你只会山寨别人的代码 别只看单机版的框架,分布式也需要了解 对于数据库,别只知道增删改查,得了解性能优化 Java核心,围绕数据结构和性能优化准备面试[详细]
-
2019 年可以选用这些 Rust IDE/DE
所属栏目:[优化] 日期:2019-10-19 热度:138
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 最近一段时间 Rust 似乎开始从默默无闻走向聚光灯下,从微软宣布探索采用 Rust 替代 C/C++,到 Linux 内核维护者表示愿意接受Rust 作为驱动开发语言,再到 AWS 公开表示赞助 Rust,同时连[详细]
-
女友闹别扭不用担心,python做个软件轻松哄好
所属栏目:[优化] 日期:2019-10-19 热度:139
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 学编程难免有时觉得枯燥,但我们可以自己用编程来做一些有趣的事情,不仅可以排解自己的无聊,还可以给女朋友一个惊喜,增进两人感情! 人们都喜欢记住一些重要的日子,比如说跟女朋友认识[详细]
-
Golang不到100行实现一套灵活的JWT库
所属栏目:[优化] 日期:2019-10-19 热度:138
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 JWT 全 chen JSON Web Tokens 现在被广泛的应用于各种前后端分离的场景,他比传统的 Token Session 方式,更具灵活性。 当然网上也有很多开源的 JWT 库,非常之多,开源组织也提供了官方[详细]
-
不会这几个库,都不敢说我会Python爬虫
所属栏目:[优化] 日期:2019-10-17 热度:193
很多朋友不知道Python爬虫怎么入门,怎么学习,到底要学习哪些内容。今天我来给大家说说学习爬虫,我们必须掌握的一些第三方库。 废话不多说,直接上干货。 1.请求库 1. requests GitHub:https://github.com/psf/requests requests库应该是现在做爬虫最火[详细]
-
Zookeeper技术:分布式架构详解、分布式技术详解、分布式事务
所属栏目:[优化] 日期:2019-10-17 热度:51
一、分布式架构详解 1、分布式发展历程 1.1 单点集中式 特点:App、DB、FileServer都部署在一台机器上。并且访问请求量较少 1.2 应用服务和数据服务拆分 特点:App、DB、FileServer分别部署在独立服务器上。并且访问请求量较少 1.3 使用缓存改善性能 特点[详细]
-
2019年StackOverflow开发人员优秀JavaScript编辑器排名
所属栏目:[优化] 日期:2019-10-17 热度:155
要问过去几年内增长最快的语言是什么?你可能会说Python。根据StackOverflow统计,在过去的几年内非常受欢迎的编程语言实际上是JavaScript,比Python,Java等流行语言更火。中国有句俗语,工欲善其事,必先利其器!,对开发人员来说代码编辑器可能是最重要[详细]
-
为Facebook跳楼华人同事发声被开除 当事人现身回应
所属栏目:[优化] 日期:2019-10-17 热度:176
9月19日,位于旧金山湾区Menlo Park的Facebook总部内,一名来自中国的员工从园区内的一栋办公楼4楼跳下,当场死亡。这名跳楼员工名为陈勤(音译),浙江大学毕业,并在美国南加州大学攻读硕士,去年3月份入职Facebook。 9月26日Facebook总部前聚集了超过20[详细]
-
面向Google编程的CopyPaste程序员要小心了!
所属栏目:[优化] 日期:2019-10-16 热度:74
张大胖最近接了一个C++的私活,在编程的时候需要生成一个字母和数字混合的随机字符串,张大胖不知道该怎么办,于是打开Google,输入关键字搜索,迅速在Stack Overflow找到了答案,还附有相关代码,他心中窃喜,直接复制粘贴过来,稍加修改,问题搞定,爽![详细]
-
大型项目该如何分层架构,该和MVC说再见了
所属栏目:[优化] 日期:2019-10-16 热度:69
最近用laravel做自己的个人博客,过程中也思考了一些问题,如何把自己的代码写的更优雅呢,为什么laravel没有models目录呢,逻辑代码,数据库查询代码要怎样放置呢? 我们一直以来都被灌输的设计思想,即M-V-C,模型(Model)、视图(view)、控制器(Controller[详细]