SegmentFault SegmentFault 思否技术人访谈最新的文章2023-09-27T15:44:10+08:00https://segmentfault.com/feeds/blogshttps://creativecommons.org/licenses/by-nc-nd/4.0/Rich Bowen: "The Ultimate Product is Trust"https://segmentfault.com/a/11900000442672722023-09-27T15:44:10+08:002023-09-27T15:44:10+08:00思否编辑部https://segmentfault.com/u/writers0<p><a href="https://segmentfault.com/a/1190000044267214">点击此处阅读中文版本,Click here to read the Chinese version</a></p><p>Rich Bowen has been involved in open source since before we started calling it. As a member of the Apache Software Foundation, Rich serves as a board member, VP Conferences and also an open-source strategist at AWS. Rich's multiple roles have granted him a more diverse and profound understanding of open source.</p><p>After he delivered his keynote speech, "Talking with Management about Open Source," at CommunityOverCode Asia 2023, we had a quick chat to explore more behind the speech. Besides management and open source, we also discussed approaches and strategies of AWS and the Apache Software Foundation (ASF) in open-source projects, what matters most for building open-source ecosystems, and how Rich manages to balance different roles, etc.</p><p><img src="/img/remote/1460000044267275" alt="" title=""></p><p><strong>SegmentFault:</strong> <strong>In recent years,</strong> <strong>many</strong> <strong>Chinese companies</strong> <strong>begin to</strong> <strong>establish their open-source program office. As a well-known open-source company, how does AWS manage, operate and promote open source?</strong></p><p>Rich Bowen: In general, AWS and Amazon have been building on open source from the very beginning. Everything that we have done has relied on open source. At Amazon, we have what we call our leadership principles. There are some things that guide the way we think.</p><p><img src="/img/remote/1460000044267276" alt="" title=""></p><p>The first one is customer obsession. We're always concerned about the customer and serving their needs foremost, so we've built all of this infrastructure, and all of these products are built on top of open source. The most important thing is that open-source projects are sustainable. Everything that we do around open source is focused on making sure that those open-source projects remain healthy. One of the things that we do is we try to choose projects and if there are several projects to choose, we try to pick one that has a healthy ecosystem and a healthy community. That can mean a lot, including the involvement of many companiesIt and transparent conversations. Then, we watch those communities closely to make sure they stay healthy, and we also attempt to participate actively to keep them healthy, and this summarizes our most critical and biggest focus.</p><p>The way that we set out to promote open source is to do it with the community. It's not like doing a promotion, instead we try to do it with the community. For example, we rely on the Apache projects so much, like Kafka and Airflow, etc. We promote them by being involved in their conferences, such as Kafka Summit and Airflow Summit. Instead of trying to do our own independent promotion, we do it with the community. In this way, we ensure the voice is from the community rather than the voice of Amazon. We also get involved in community events, like KubeCon or open-source summits.</p><p><strong>SegmentFault:</strong> <strong>It's more about making the company step back, but for some open-source companies invested in the project a lot, making clear decisions can be difficult. They might blur the lines due to investment or treat the project as their brand.</strong></p><p>Rich Bowen: That's correct. Occasionally, you'll see the promotion of an open-source project, and you'll wonder, are they talking about the project or are they talking about the company? It's hard to tell.</p><p>Like any big company, there's going to be a difference between one department and another. But my job, as an open-source strategist, is to engage with those departments and advise them on what we believe to be the correct way to engage, which is to put the community first and not us.</p><p><strong>SegmentFault:</strong> <strong>Could you please share with us some astonishing AWS open-source projects?</strong></p><p>Rich Bowen: There are two main types of open-source communities that Amazon is involved in. From my perspective. There are ones that are primarily Amazon, and there are ones that are primarily community.</p><p><img src="/img/remote/1460000044267277" alt="" title=""></p><p>Some open-source projects that we're involved with are focused around one of our services, and so there's no real incentive for other people to get engaged in it unless they're customers. There are ones like Apache Kafka, where there are many companies involved. I'm primarily interested in that second kind, the ones that are real community projects. At Amazon, most of the projects that I'm involved with are, in fact, Apache projects.</p><p>One of the projects that I'm most excited about is Apache Airflow because it's a project where Amazon is very involved. We've got plenty of full-time engineers who are working on it, but the project is not owned by Amazon. It's a community project, and there are many companies involved. That is one of the models for the best way that we engage in projects from my perspective.</p><p><strong>SegmentFault:</strong> <strong>From your perspective, how to build an open-source ecosystem?</strong></p><p>Rich Bowen: Transparency is the most important thing. All the discussions regarding Apache Airflow take place on the Apache Airflow mailing list. We don't have an internal meeting and then go to the project saying “Here's what we've decided”, instead, we make a proposal to the community, and it's discussed and decided in the community. So transparency and working in public is the first part of that.</p><p>The second part of that is listening with humility. It's not like I have the answers, and you should agree with me. It's listening to what the entire community thinks and then making the decision together. One of the early thinkers in open source was Bill Joy, and he founded Sun Microsystems. One of the things that he said, and I always think about is, no matter what company you work for, the smartest people in the world work somewhere else. So, thinking your team has all the answers is arrogant and short-sighted. You should listen because the best ideas always come from somewhere else because they make you think in a new way.</p><p>So, listening is the biggest part there. You have to earn trust from the community because it’s hard to gain trust, but it's so easy to lose trust. You have to be respectful, listen politely and calmly, and contribute your ideas, but don't try to force people to see your perspective.</p><p><strong>SegmentFault:</strong> <strong>Now that you work both for AWS and the Apache Software Foundation, do you find there are some similarities and differences?</strong></p><p>Rich Bowen: Yeah, the most significant difference is obviously the motivation. Companies exist to serve customers and make money. That's what we're there for. The Apache community exists to produce free software for the public good.</p><p>But from there, I see a lot of overlap because as I mentioned earlier, customer obsession is our top leadership principle, and that's the same thing with an open-source project. If you're not focused on the user, then you're missing the point.</p><p>As for a company to be successful, you have to think of all the users as your customers, whether they're paying you or not. They might someday, maybe they won't. But you need to make sure that you're developing products that people want, so that's the same thing with open source.</p><p>One more thing that remains constant between a prosperous company and a thriving open-source community is that no matter what you're creating – be it a car, a service, or software – the ultimate product is trust.</p><p>Do your customers trust you? Because if they don't trust you, no matter how good your product is, they're going to go somewhere else, which is the same in open-source communities. Trust is always the most important thing. If your open-source community burns the trust of the users, no matter how good your product is, they're not going to use it. We deal with open-source projects weekly, where they will decide without consulting the community. Then everybody goes to some other product just overnight, and trust is the biggest thing of that.</p><p><strong>SegmentFault:</strong> <strong>From the foundation or community perspective, is there any conflict when you present different roles? Let’s say, having the feeling of it's the wrong way to go?</strong></p><p><img src="/img/remote/1460000044267278" alt="" title=""></p><p>Rich Bowen: Yeah. What's important about when you have a conflict of interest is to be honest about it, to be transparent.</p><p>For example, there are projects that my company relies on very heavily, and I may want the project to make a certain decision. Or one of our competitors is involved in the project and I may not want them to be successful. So it's critical for me to say when I'm having these conversations, by the way, I work for Amazon, these are our interests, this is our potential conflict of interests. Then, once you have disclosed that, you would try to put the community first.</p><p>This goes back to an earlier point. It's significant that all of your involvement with the projects is transparent and upstream first. Because if you're making decisions internally and then taking them to the project, you're not putting the project's interests first. But if you're focused on your customers and your users, then you want the project to be successful. There's a phrase in English, the tide lifts all boats, which means if I make the project successful, I'm going to help my competitors and that's okay. Because the tide lifts all of us, and we collaborate on this thing. Maybe I'm helping my competitors, but mostly I'm helping my customers.</p><p><strong>SegmentFault:</strong> <strong>What aspects of open source should management be aware of, and why are these aspects particularly critical?</strong></p><p>Rich Bowen: Okay. So I think that one of the most critical things for management to understand is that open source is part of the supply chain.</p><p>No matter what your product is, you rely on raw materials, natural resources coming from somewhere else. If you just consume, then at some point you're going to run out of it. If we think about open source as our raw materials, then we have an obligation to make sure that that source of raw materials continues to be healthy. So if you are a carpenter, you want to make sure there is always a forest, you plant new trees rather than just cut it down. So what I try to communicate to management is that sustainability is our job. It is our job to make sure that projects we rely on remain healthy.</p><p><img src="/img/remote/1460000044267279" alt="" title=""></p><p>Now, historically, there are many companies that have built businesses on top of open source without contributing back, which lead to several situations. One is that the project will resent you and find ways to oppose you. You end up in a situation where you've built a product on top of something that maybe they changed their license to cut you out of the picture.</p><p>The other is that if you don't actively participate, then you don't have a voice in the decisions that are made. Perhaps the project will go in a direction that doesn't benefit you. And so active participation in your supply chain is critical. And this is true. It's not just true in software, it's true in any business. If you rely on coal, then you should understand how the coal business works so that you can see months or years in advance when a problem is coming. That is the most important thing to me.</p><p>The last thing is trust, which is again tied to transparency. You need to make sure that you are in open communication with the project, and you don't make decisions, you don't do your marketing in ways that annoy the community or ways that embarrass or devalue the community. You need to do it in ways that give credit, give the correct credit to the people who are doing the work.</p><p><strong>SegmentFault:</strong> <strong>You mentioned consuming and applying open-source softwares which brings up another topic: contribution. What challenges do management teams face when using, contributing to, or applying open-source software? How can these challenges be addressed?</strong></p><p>Rich Bowen: I think the biggest difficulty that businesses have in working with open source, and I mentioned in our round table yesterday, is being patient. When you try to make a decision in an open-source project, you can't just have your manager say, ‘This is how we're going to do it’. You have to discuss it.</p><p>Occasionally, you have to wait days or weeks to arrive at a decision, and that is very frustrating for companies that want to launch a product. As I have a product launch deadline and an upcoming conference where I need to announce a new feature, but you can’t do that with open source. That makes it a challenge to communicate to management why they should wait.</p><p>The reason that they should wait is that we are customer obsessed, and the users are our customers. We need to make sure that we have time, and we have to be patient to hear back from the customers. So if I have this great idea for a new feature, I'm excited about it. I want to launch it, but the users don't think it's a good idea, then eventually it will fail and so it is worth waiting for. You can even consider it to be market research, it's worth waiting to hear back from the user community. The developers involved in a project are representative of themselves, and they're the most knowledgeable users, also the power users. We have to make sure that we include them in that decision process, and that's hard to communicate to managers about deadlines.</p><p><strong>SegmentFault:</strong> <strong>So there’s a natural conflict between management, which represents the company, and the open source. How can you convince management that understanding open-source concepts benefits in aligning strategies to meet business goals?</strong></p><p><img src="/img/remote/1460000044267280" alt="" title=""></p><p>Rich Bowen: Going back to my earlier question, I think that having them understand that this is their source of materials and their supply chain. I find that kind of metaphor is the most useful: if we're selling milk, we need not kill the cow.</p><p>Now, some people will say, ‘We should just buy the cow, own it and ignore the farmers. We should just do this ourselves’. It’s important for a business to understand what they’re uniquely good at and things to leave behind. So you collaborate on the things that are common, and then concentrate as a company on the things that you're uniquely good at.</p><p>For example, AWS is entirely about and good at hosting network services. We have data centers all over the world. We have enormous scale, fast networks, and talented system administrators. But the software that we run is developed by the entire world, the entire community, and we share that. Then, we focus on what we're uniquely good at.</p><p>I spent nine years at Red Hat. Red Hat is not a software company. Red Hat sells support instead of software. What I would advise salespeople is not to emphasize being the best software producers in the world, as the software is made communally. What we're good at is selling support. That was the message that I thought a lot about in my Red Hat years, which is very much the same thing at AWS.</p><p><strong>Learn more about Rich's thoughts and insight on open source in his blog at</strong> <strong><a href="https://link.segmentfault.com/?enc=3JadNwjUgac90hyNrGa8gg%3D%3D.MaSTqggraGxh8beExaaby%2BZBDyKKbUj8dokH2AtMv8o%3D" rel="nofollow">DrBacchus.com</a></strong><strong>.</strong></p><hr><p>Author: <strong>Anne Zhu</strong><br>Anne Zhu is the community manager of Answer, SegmentFault.</p>Rich Bowen: 无论你在创造什么,最终交付的是信任https://segmentfault.com/a/11900000442672142023-09-27T15:36:43+08:002023-09-27T15:36:43+08:00思否编辑部https://segmentfault.com/u/writers2<p>早在开源被我们称之为开源,Rich Bowen 就已经参与其中。作为 Apache 软件基金会的成员,Rich 目前担任董事会成员、会议副总裁。此外,他还是 AWS 的开源策略师。这些多重角色赋予了他对开源的更广泛和深刻的理解。</p><p>在他于 2023 年 CommunityOverCode Asia 发表了“与管理层谈论开源”的主题演讲后,我们和 Rich 坐下来一起探讨了演讲背后的更多内容。除了管理层和开源,我们还讨论了 AWS 和 Apache 软件基金会在开源项目中的方法和策略,构建开源生态系统最重要的因素,以及 Rich 是如何平衡不同的角色等话题。</p><p><img src="/img/remote/1460000044267216" alt="" title=""></p><p><strong>思否:近年来,中国的公司相继设立开源计划办公室。作为一家知名的开源公司,AWS 是如何管理、运营和推广开源的呢?</strong></p><p>Rich Bowen: 总的来说,AWS 和亚马逊从一开始就一直在基于开源进行构建,我们所做的一切都依赖于开源。在亚马逊,我们遵循领导力准则,这些准则影响着我们的思考方式。</p><p><img src="/img/remote/1460000044267217" alt="" title=""></p><p>第一个准则是顾客至尚。我们始终关注客户并优先满足他们的需求,所以我们构建了所有这些基础设施,而这些产品都建立在开源技术之上。最重要的是,开源项目必须具备可持续性。我们在开源上所做的一切,首先需要确保这些开源项目保持健康的运行。我们还有一项工作是项目选择,如果有多个项目可供选择,我们会尽量选择一个拥有健康生态系统和强大社区的项目。这意味着很多事情,包括众多公司的参与以及透明的项目沟通。接下来,我们会密切关注这些社区,确保它们的生态是健康的,同时我们也会积极参与社区维护,这是最重要也是我们关注的焦点。</p><p>我们推广开源的方式不是独立进行的,而是是与社区一起。例如,我们非常依赖 Apache 项目,如 Kafka 和 Airflow 等。我们通过参与他们的会议,比如 Kafka Summit 和 Airflow Summit 去进行推广。通过和社区一起推广,我们可以确保这是社区的看法,而不是亚马逊的看法。此外,我们还会参与社区活动,如 KubeCon 或开源峰会。</p><p><strong>思否:这更像是让公司退居幕后,但对于一些在项目中投入了大量资源的开源公司来说,做出清晰的决策可能会很困难。他们可能会因为投资而模糊界限,或者将项目视为自己的品牌。</strong></p><p>Rich Bowen:的确如此。有时你会对一个开源项目的推广产生疑惑,他们是在谈论项目还是在谈论公司?这很难区分出来。</p><p>像任何大公司一样,不同部门之间会存在差异。但作为一名开源策略师,我的工作是参与部门其中,并为他们提供建议,告诉他们我们认为正确的参与方式,即把社区放在第一位,而不是我们自己。</p><p><strong>思否:你能分享一些优秀的 AWS 开源项目吗?</strong></p><p>Rich Bowen:从我的角度来看,Amazon 参与的开源社区主要分为两种类型。一种是主要由亚马逊主导的,另一种是主要由社区主导的。</p><p><img src="/img/remote/1460000044267218" alt="" title=""></p><p>我们参与的一类开源项目是围绕我们某项服务的,因此除非他们是客户,否则其他人没有真正的动力参与其中。还有一类项目是很多公司参与进来的,比如 Apache Kafka。我主要关注的是第二类项目,也就是真正的社区项目。在亚马逊,我参与的大多数项目实际上都是 Apache 项目。</p><p>我最为兴奋的项目之一是 Apache Airflow,因为这是一个亚马逊积极参与的项目。虽然这个项目并不属于亚马逊,但我们有很多全职工程师也参与其中。作为一个社区项目,也有许多其他公司参与其中。我个人认为,这是我们最佳参与项目方式的模型之一。</p><p><strong>思否:在你看来,该如何建立一个开源生态系统呢?</strong></p><p>Rich Bowen:保持沟通透明是最重要的事情。所有关于 Apache Airflow 的讨论都通过邮件进行。我们并不会进行内部会议,然后通知项目:“这是我们做的决定”。相反,我们向社区递交提案,接着在社区中进行讨论和决策。所以,一切的前提是保持公开透明。</p><p>第二部分是怀着谦卑去倾听。不是因为我有答案,所以你应该同意我的观点,而是要倾听整个社区的想法,然后共同做出决策。开源领域的早期思想家之一比尔·乔伊(Bill Joy),他创办了 Sun Microsystems 公司。我一直记得他说过的一句话:<strong>不管你在哪家公司工作,世界上最聪明的人都在别处工作。</strong>所以,认为你的团队拥有所有答案是傲慢和短视的。最好的想法总是来自其他地方,所以更应该倾听,因为它们能给你一种新的方式思考。</p><p>所以,倾听也是其中一个重要的部分。获取信任很难,而失去信任却很容易,所以你必须赢得社区的信任。尊重他人,礼貌和冷静地倾听,贡献自己的想法,但不要试图强迫别人接受你的观点。</p><p><strong>思否:你既在 AWS 工作,又在 Apache 软件基金会工作,这两者之间有哪些相似和差异?</strong></p><p>Rich Bowen:最显著的差异是动机。公司存在的意义是服务客户和盈利,而 Apache 社区存在的意义是为了公众生产免费软件。</p><p>但从某种程度上,两者之间是有一些相似的地方。正如我前面提到的,顾客至尚是我们的首要领导力准则,这和开源项目是一致的。如果不专注用户,那你就失去了意义。</p><p>对于一家想要成功的公司,无论用户是否付费,你仍必须把他们都当做你的客户。也许他们未来会付费,也许不会,但你仍需要确保你们在开发人们需要的产品,这在开源领域也是同样适用的。</p><p>在繁荣的公司和蓬勃发展的开源社区之间还有一件不变的事物,那就是无论你在创造什么——汽车、服务还是软件——最终你交付的产品还是信任。</p><p>您的客户是否信任你?如果他们不信任你,无论你的产品有多好,他们都会离开你,这在开源社区中也是一样的。信任永远是最重要的事情。如果你的开源社区失去用户的信任,无论产品有多好,他们都不会使用它。我们每周都会跟进一些开源项目,这些项目会在不听取社区反馈的情况下做出决策。这种不透明的做法导致了信任的缺失,使得这个项目一夜间流失了所有用户。</p><p><strong>思否:从基金会或者社区的角度来看,当你以处在不同角色的时候,是否存在冲突?也就是说,是否会有一种感觉,认为这样做是错误的?</strong></p><p><img src="/img/remote/1460000044267219" alt="" title=""></p><p>Rich Bowen:会的。当存在利益冲突的时候,重要的是坦诚面对,并保持透明。</p><p>例如,有一些项目是我所在公司高度依赖的,我可能会想让该项目做出特定的决策。或者当我们的竞争对手参与了该项目,我可能不希望他们成功。因此,在进行这些讨论的时候,对我来说非常重要的一点是,需要坦率地表达出,我在亚马逊工作,这些是我们的利益,这些是潜在的利益冲突。在表述后,我会努力将社区的利益放在首位。</p><p>这和之前我提到的观点有关。项目的所有参与是透明的并以上游为先,这两者都很重要。因为如果你在内部先做出决策,然后将其带到项目中,那就没有把项目的利益放在首位。但如果你专注于你的客户和用户,那么你会希望项目能成功。有一句谚语叫水涨船高,这意味着如果我使项目成功,我会帮助我的竞争对手,这是可以接受的。因为涨潮推动了我们所有人,我们一起合作这个项目。看起来我或许在帮助我的竞争对手,但我主要在帮助我的客户。</p><p><strong>思否:那么管理层应该关注开源的哪些方面,以及为什么这些方面尤其关键?</strong></p><p>Rich Bowen:我认为管理层最需要理解的一点是,开源是供应链的一部分。</p><p>无论你的产品是什么,都需要其他地方的原材料和自然资源。如果你只是消耗,那么最终将耗尽资源。如果我们把开源看作是我们的原材料,那么我们有责任确保这一原材料源头的健康。如果你是一名木匠,你会希望确保森林始终存在,你会种植新的树木,而不仅是砍伐。因此,我试图向管理层传达,我们的责任是维持可持续性。我们有责任确保我们依赖的项目是健康的。</p><p><img src="/img/remote/1460000044267220" alt="" title=""></p><p>历史上,有许多公司构建了开源的业务模式,却没有回馈社区,这导致了几种情况。其中一种情况是,项目可能会对你产生敌意,并寻找方法来反对你。最终,你可能会陷入这样一种情况,你在某个基础上构建了产品,但该项目可能更改了许可证,将你排除在外。</p><p>另一种情况是,如果您不积极参与,那么在项目决策中,你就没有发言权。也许项目会朝着不符合你的利益方向发展。因此,积极参与供应链其中是至关重要的。这一点不仅在软件领域如此,对于任何业务来说都是如此。如果你依赖煤炭,那么你应该了解煤炭业务的运作方式,以便可以提前几个月或几年看到将出现的问题。这对我来说是最重要的事情。</p><p>最后一个是信任,这又与透明有关。你需要确保与项目进行开放的沟通,并且不做出让社区感到恼火、尴尬或贬低社区的决策或营销方式。你需要给予向那些正在工作的人正确的赞誉,并按这种方式去做事。</p><p><strong>思否:你提到了使用和应用开源软件,这让我想到了另个话题:贡献。管理团队在使用、贡献或应用开源软件时会面临哪些挑战?又该如何解决这些挑战呢?</strong></p><p>Rich Bowen:我认为企业在与开源合作时面临的最大困难,我在昨天的圆桌讨论中也提到过,就是要有耐心。当你尝试在开源项目中做出决策时,需要进行讨论,而不能仅仅让你的经理说:“这就是我们要做的方式。”</p><p>有时,你必须等待数天甚至数周才能做出决策,而这对于需要发布产品的公司来说是非常沮丧的。例如,我有一个产品发布的截止日期,还有需要在即将到来的发布会上宣布新功能。而在开源项目中,你不能这么做。这就是一个挑战,你需要向管理层解释他们为什么应该等待。</p><p>我们以客户为导向,而用户就是我们的客户,所以我们应该等待。我们需要确保我们有时间和耐心等待用户的反馈。当我对一个新功能有了很好的想法,我会感到兴奋并想要推出它,然而用户认为这不是一个好主意,那么最终这个功能将失败,所以我们需要等待。你甚至可以将其当作为市场研究,而来自社区的用户反馈是值得等待的。参与项目的开发人员代表了他们自己,他们是最了解产品也是最有经验的用户。所以我们必须确保他们在决策过程中,而这使得和管理层沟通截止日期的问题变得很难。</p><p><strong>思否:管理层代表着公司,和开源其实是有天然的冲突。那么,你将如何说服管理层,理解开源的概念有助于策略调整以实现业务目标?</strong></p><p>Rich Bowen: 回到之前的问题,我认为让他们理解原材料和供应链是很有用的隐喻:如果我们售卖牛奶,那就不应杀掉奶牛。</p><p>如今,有些人会说,“那我们应该买下奶牛,不理会农民,我们应该自己做这些事情。”对于一家企业来说,理解自己在哪些领域有独特的优势,以及舍弃哪些领域是很重要的。因此,你可以在共同的领域进行合作,而专注于具有独特优势的领域。</p><p>例如,AWS 完全致力并擅长托管网络服务。我们在世界各地都有数据中心,我们拥有庞大的规模、快速的网络和才华横溢的系统管理员。但我们运行的软件是由全世界和整个社区共同开发的,我们与他人分享这些资源。然后,我们专注于我们独特擅长的领域。</p><p>我在红帽工作了九年。红帽并不是一家软件公司,它出售技术支持服务而不是软件。我会建议销售人员不要强调自己是世界上最优秀的软件生产商,因为软件是由社区共同开发的,而我们擅长的是销售支持服务。这是我在红帽工作期间思考了很久得出的结论,而在AWS也有着相似的情况。</p><p>你可以访问 Rich 的博客 <a href="DrBacchus.com">DrBacchus.com</a>,了解更多关于他对于开源的想法和见解。</p><hr><p>作者: 大花</p><p>Anne Zhu is the community manager of Answer, SegmentFault.<br>大花是思否旗下开源问答软件 Answer 的社区经理。</p>专访 CCF CED 工程师文化日筹委会:带你走进大会幕后的故事https://segmentfault.com/a/11900000426328192022-10-17T15:12:25+08:002022-10-17T15:12:25+08:00思否编辑部https://segmentfault.com/u/writers0<p>近年来,AI、云计算等前沿技术的持续发展,正不断加速全球数字化转型进程。在以技术为驱动力的当下数字社会里,工程师文化也开始被全球各地重视甚至普及开来。自去年国内“第一届中国工程师文化日 CCF CED ”举办以来,该激发工程师潜力的活动便备受业界关注。<strong>今年 10 月 23 日,即将于北京举办的 “CCF CED 2022—第二届 1024 中国工程师文化日”精彩来袭</strong>,届时国内工程师、程序员及软件技术爱好者们将再次欢聚一堂,共同为推动行业发展贡献更多力量。 </p><p>目前,“<strong>CCF CED 2022—第二届 1024 中国工程师文化日</strong>”的最终呈现已进入倒计时,为了更好地呈现 CCF CED 工程师文化日内核,SegmentFault 思否特别专访了幕后辛苦筹备本次会议的 CCF TF 工程师文化 SIG 组的成员们,挖掘大会筹备背后的故事,也与大家聊聊何为工程师文化、工程师文化的意义与价值。一起来看看吧!</p><p><img src="/img/bVc22TU" alt="" title=""></p><h2><strong>关于 CCF CED 及筹委会团队</strong></h2><h3><strong>CCF CED:</strong></h3><p>1024 中国工程师文化日 CCF CED(China Engineers' culture Day),是面向技术型组织的工程师文化日,旨在连接技术型企业中的技术委员会主席、技术文化与品牌负责人、技术学院院长,以及广大工程师群体。</p><h3><strong>筹委会 SIG 组成员:</strong></h3><p>吴华,CCF TF主席、百度技术委员会主席<br>刘付强,CCF TF 工程师文化 SIG 主席、msup创始人兼 CEO<br>应阔浩,CCF TF 工程师文化 SIG 副主席、自如技术委员会主席<br>郭悦,CCF TF 工程师文化 SIG 委员、亚马逊开发者市场总经理<br>崔婧,CCF TF 工程师文化 SIG 委员<br>高阳,CCF TF 工程师文化 SIG 委员,SegmentFault 思否 CEO<br>余知权,CCF TF 工程师文化 SIG 委员、连尚网络技术委员会执行秘书<br>石松,CCF TF 工程师文化 SIG 委员<br>仲博文,CCF TF工程师文化SIG委员,小红书技术品牌&合作总监</p><p><img src="/img/bVc22TV" alt="" title=""></p><h2><strong>“技术驱动创新”本质:尊敬开发者,敬畏技术力量</strong></h2><h4><strong>Q:为什么想要举办工程师文化日?希望对行业起到怎样的推动作用?</strong></h4><p><strong>郭悦</strong>:我心中一直有一个强烈的感受,现在我们推广文艺界的明星、大咖的渠道和平台特别多,反观工程师群体,这些利用技术、不断创新、通过双手在创造美好未来的“明星”们很少被大众认知。不论是互联网、航空航天、生物医疗、制造业、土木工程等等领域都有大量优秀的幕后工程师们没有机会被我们推广,像这次能邀请到“天问一号”的总工程师这样的民族英雄我感到特别的开心与自豪。所以积极推动工程师文化系列活动的落地,并投身于中国工程师文化组织的志愿者,希望能够帮助这些工程界的“英雄们”从幕后走到台前,将他们身上优良的文化更好的传递,鼓舞我们一代又一代将担当、创新、协作、追求极致等精神文化发扬光大。</p><p><strong>石松</strong>:1024 是 2 的十次方,二进制计数的基本计量单位之一。作为基本理论知识,程序员更不陌生。我的工作经历更加深刻,每年的 10 月 24 日,公司都会举行相关活动,认同并非常有价值的活动。CCF 工程师文化 SIG 小组成立,付强总第一时间找我谈这个组织的定位及希望加入这个组织,并承担一些事务。我欣然接受,背后是对这个组织的认可,对开发者的尊敬,对工程师文化的认可,对技术力量的敬畏。“技术驱动创新”最底层还是人的力量,特别是开发者的群体。希望通过我的能力和经验,贡献一份力量,传递一份价值。</p><p><strong>应阔浩</strong>:2021 年 4 月,工程师文化 SIG 征集全年规划,我们在想能否做一场有体感、更燃、让大家更有认同的活动,我头脑中第一个浮现的就是“双11”。从趋势看,1024 是大家的共识,企业内部逐步都在举办自己的 1024 活动,1024 是一种趋势;从工程师群体看,计算机行业发展的 100 年,是无数工程师一个个 0 和 1 堆起来的,是非常值得敬佩的一个群体,这样的群体很“神秘”,默默无闻却也有很多面,缺少让世人知道的机会; 跟付强总在咖啡馆达成共识:10 年以后,工程师群体会不会有一个共同的节日,会不会有其他组织把这个节日做起来,类似 10 年前的淘宝,如果有,为什么不是我们呢?因此,我们坚定了去做 CCF CED 的想法。</p><p><strong>仲博文</strong>:工程师们值得有一个属于自己的节日,我们也希望有这么一个工程师文化日,让大家认识到工程师群体,他们不仅是刻板印象中的格子衬衫保温杯,更是一群有热血梦想,有极致追求的有着少年气的成年人。</p><h4><strong>Q:您是如何加入到 TF 工程师文化 SIG 组的?在活动筹备和日常组织建设中有没有什么有趣的小故事?</strong></h4><p><strong>高阳</strong>:今年受郭悦邀请,我加入了 CCF TF 工程师文化 SIG,文化是创新的源动力,作为国内领先的新一代技术问答社区,我们一直关注工程师文化、开源文化的建设。从 2012 年起,我们就在国内外组织各种各样的技术大赛和黑客马拉松(Hackathon),也是希望以此来推动企业和组织工程师文化的建设,用代码推动创新。</p><p><strong>刘付强</strong>:CCF TF 是面向企业间常态化合作交流的平台,促进技术型企业交流切磋,目前已组建知识图谱、数据科学、智能制造、架构、安全、智能设备与交付、产业智能化、算法与 AI、智能前端、工程师文化、研发效能 11 个 SIG(Special Interest Group)。工程师文化这个主题由时任自如 CTO 王迪创建,他曾在领英中国担任技术副总裁推动产品变革,后续加入产业互联网代表自如,非常钦佩王迪带出了中美两个最棒的工程创新团队。<br>记得 2020 年初,我正在准备第十一期硅谷研修之旅,由于经常领队国内技术公司 CTO、技术副总裁到美国访学研修,对各家公司的技术文化、团队氛围有些体会,同时,工作缘故结识了很多国内外科技公司的技术委员会主席、技术学院院长,时任 CCF TF 主席、京东技术副总裁何晓冬和 CCF 副理事长、前微软亚洲研究院副院长、现创新工场首席科学家周明推荐我加入 CCF TF,我看到工程师文化这个主题非常认同、兴奋,因为“culture eats strategy for breakfast.”——Peter F.Drucker,每期硅谷研修之旅开场白,我都会把这句文化可以把战略当早餐吃掉带上,希望队友们不仅仅关注技术前瞻、产品创新,作为团队领导者更要关注文化属性!也许我能做些贡献,为中国计算机行业的创新文化和学习氛围做点儿事,就接下了王迪的旗帜。</p><p><strong>余知权</strong>:CCF 是多年前位朋友 高博 引荐加入的 ,之前主要以被动参与为主,而在 TF54 关于工程师成长地图的线上活动,有幸得到 付强总 的召唤,能够有机会共同组织 CCF CED。1024 对于程序员和软件工程师非常有意义的活动,之前自己有在公司内部也组织过类似活动,包括:黑客马拉松 Hackathon、 技术分享沙龙 TechMix 和 技术午餐会 Brown Bag 等,现在把其提升到行业高度,各个公司之间交流平台,是个更有价值的事情。</p><h2><strong>“工程师文化”内核:工匠精神的高科技版,人才是关键</strong></h2><h4><strong>Q:您如何理解工程师文化?</strong></h4><p><strong>崔婧</strong>:今天的中国是拥有工程师最多的国家。在过去 20 年时间里,中国培养了六千万名工程师。有专家提出,用不了几年,中国工程师数量将比德国人口数量还要多。一个优秀的工程师能够为企业带来的往往是长久的利益,不论是一个设计完美的机器,还是一个简单易用的产品。个人认为,工程师文化是工匠精神的高科技版本。</p><p><strong>高阳</strong>:在我看来,企业的工程师文化就是一个公司工程师们的共识和价值选择,比如:保持好奇、勇于探索、匠心与专业……当遇到问题时,这种文化会指引着我们如何行动、如何选择、如何排列事件的优先级、如何更好地协作。好的工程师文化对内可以激发创新,提升效能,突破瓶颈,为企业带来新的增长曲线;对外可以不断吸引优秀技术人才的加入,为企业带来新的活力。</p><p><strong>应阔浩</strong>:从管理的角度,对于工程师的管理或者技术团队的管理都是比较独特的,也是有很多共性的,对于工程师需要什么样的管理方式,需要构造一种什么样的文化,是众多管理者的需求;从个人成长的角度,工程师怎么成长也是非常迷茫的,以人为师是一种很好的学习方法。文化是虚的,虚事更要实做,需要“可视化”,这其实也是为什么我们选 1024 这一天的原因,我们看到“M”就会想到麦当劳,看到绿色就会想到星巴克,看到 11.11 就会想到天猫、电商,对于工程师文化也一样,我们要让大家看到一些符号、标志,让大家感受到日常的工作周围都是技术的气息,比如荣誉墙、技术标语、奖杯,这都是空间维度;更重要的是从时间维度,从工程师生命周期的维度,从面试的那一刻开始、到 offer、到试用期、到第一个项目、到第一次晋升,有没有一个“闪光”的时刻令你记忆犹新?有没有美好的故事让你流连忘返?当你遇到难题不知所措时,有师兄帮你答疑解惑;当你技术选型不知孰优孰劣时,有成熟的文档知识库供你参考决策;当你项目上线时,有庆功会为你点赞喝彩;当你答辩晋升时,有大牛帮你辅导指引;比起“虚”的标语口号,这些“故事”才更加落地,这些人这些事才会更好地让文化得以传承虚事要实做,文化才更有意义。</p><p><strong>余知权</strong>:企业的产品和业务固然重要,但根本是其背后的团队和人才,工程师文化则集中体现团队和人才的价值观,大家如何看待事情和处理问题,CED 工程师文化宣言,则可以很好的指导企业构建优秀的工程师文化的标准。</p><h4><strong>Q:工程师文化对于企业保持持续的竞争力有什么帮助?</strong></h4><p><strong>崔婧</strong>:企业在持续创新的步调下,开始倡导工程师文化,并增设大量工程师岗位。就像企业文化是企业的指路灯,建立浓厚的工程师文化,成为一家技术型公司,未来才能走得更远。工程师以解决问题为导向的核心和精髓就是企业持续竞争力的最佳保障。</p><p><strong>郭悦</strong>:文化是具有很强的凝聚力,是一种信念,即是期待愿景,又是要求准则,它约束且指引着个人和团队向前,好的工程师文化对科技企业是很好的催化剂它能推动企业更好的创新、提升工程效能并推动企业良性的发展走得更大更远,并推动社会的进步。</p><p><strong>石松</strong>:工程师文化是一种象征,也是企业文化的拓展。工程师文化强调的是团队有目标、有分工、有协作,非一个人或几个人就能打造起来的,需要公司老板的认同,有了自上而下的认同和支持,团队的创新动力和技术才华才能真正得到激发,发会能动性,实现企业共赢。</p><p><strong>余知权</strong>:工程师文化可以很好展示企业对工程师的重视,吸引更多优秀人才加入;优秀的工程师文化,更可提升工程师工作的效率和满意度,从而获取更有竞争力。</p><h4><strong>Q:您认为中国企业工程师文化构建存在哪些机会和挑战?</strong></h4><p><strong>刘付强</strong>:工程师文化在企业发展的不同阶段具有不同的定位和作用,上个月和阿里巴巴 CTO 程立、百度技术委员会主席吴华共创研讨“工程师文化宣言”时也提到这个问题,当企业发展初期阶段,工程师文化构建需要具备伟大愿景与使命感召力,激发工程师群体创造力、创新力,促进技术推动商业变革;当企业发展到一定规模、达到平台级的阶段,工程师文化应该刷新追求卓越工程、更上一层楼的精神,凝聚大家挑战新我、不断突破,构建全新的数据驱动、智能化引领的指数型组织;当企业规模达到行业领导位置,工程师文化升级更加开放、担当,赋能行业技术生态建设,承担社会责任、技术公益、科技向善。</p><p>工程师文化是企业与员工的纽带,也是组织实现目标、工程师持续发展的保障体系,工程师文化最大的挑战也在于此,知行合一:是否推动组织目标实现。</p><hr><p>你所在的公司/团队有工程师文化建设吗?<br>你又如何理解工程师文化?<br>看完大咖们的访谈过后,你对工程师文化是否有了新的思考?</p><p>CCF TF 工程师文化 SIG 组向广大开发者、信息技术从业者与爱好者发出邀请:让我们因「1024」而相聚,相信精心策划的 “<strong>工程师文化驱动创新” 主题演讲、全球数十位的 CTO 工程师文化大咖说、工程师文化脱口秀和闪电演讲</strong>等环节,将为我们带来新的认知和理解,谈笑间洞察工程师文化,共同推动工程师文化落地、激发工程师创造价值,<strong>让技术改变世界</strong>!</p><p><img src="/img/bVc23is" alt="55faef3aa9971b751ee8eef73cf21e0.jpg" title="55faef3aa9971b751ee8eef73cf21e0.jpg"><br>扫描二维码报名参与大会</p>华为王泽锋:协作创新、开源的魅力所在https://segmentfault.com/a/11900000425898292022-10-10T10:13:11+08:002022-10-10T10:13:11+08:00思否编辑部https://segmentfault.com/u/writers2<blockquote>受访者:王泽锋(Kevin Wang),华为云云原生开源负责人,CNCF大使,CNCF技术监督委员会贡献者,Kubernetes资深维护者,KubeEdge、Volcano、Karmada等多个CNCF项目发起人,目前负责华为云在云原生开源社区的整体工作,对Kubernetes及云原生技术有深入的见解。</blockquote><p><a href="https://www.bilibili.com/video/BV1yG411E7i2/?aid=431441260&cid=857604832&page=1">https://www.bilibili.com/vide...</a></p><blockquote>如果脱离了社区,只有一份公开的代码,这样的项目是没有生命力的。<br>——王泽锋</blockquote><p>开源究竟有着怎样的魅力?很多开源的从业者都会有自己的解读。当这个问题摆在王泽锋面前,他的回答令人深感信服。 </p><p>初见王泽锋,人们很难将他的形象与那一连串头衔联系在一起。作为华为云原生开源团队负责人、KubeEdge[1]、Volcano[2]和Karmada[3]等项目联合创始人、CNCF社区官方大使,王泽锋可谓开源技术领域的“大神”级人物。在深入交流后,他给人留下的印象却更多是一位喜欢音乐、爬山和养鱼,同时对开源文化与技术充满热情的邻家大哥;而谈起自己的成就却是云淡风轻。 </p><p>其实,王泽锋主导发起的KubeEdge项目应用在日常生活中可谓“随处可见”。 </p><p>2020年,当全国范围内的高速公路收费站准备开始全面推行ETC收费模式时,一个前所未有的IT技术难题摆在了中国高速路网系统面前。公路网络需要在各个省市自治区部署总计约10万台门架系统和相应的控制器与边缘终端,部署运行超过50万个应用,通过收费专网向各省和路网中心上传数据,这放眼全球都是前所未有的大规模边缘设备部署和管理需求。面对这一重大技术挑战,经过仔细的调研和评估,项目方最终选择了面向边缘计算场景,专为云边协同设计的KubeEdge开源项目。</p><p>KubeEdge在ETC系统中帮助管理总计约100,000个边缘节点和500,000个边缘应用程序,每天处理超过3亿条数据,将收费站的交通效率提高了10倍,人们的高速出行由此变得更为便捷。</p><p><img src="/img/bVc2RHF" alt="image.png" title="image.png"><br> ▲KubeEdge边缘计算项目在高速ETC的应用 </p><p>除了高速公路ETC收费网络这一大规模实践应用外, 在智慧航天领域,2021年首颗搭载基于KubeEdge云原生边缘计算的“天算星座”计算平台[4]的试验卫星在轨稳定运行,KubeEdge帮助商业卫星上的边缘计算设备实现在轨图片分析,甚至进行本地化AI模型训练和算法改进,从而挑选出有价值的卫星图片向地面传输,节约宝贵的天地连接带宽;中海油使用KubeEdge为大型海上智能油田赋能,构建“海陆协同”新范式;上汽集团智能汽车成功搭载KubeEdge进入智能汽车领域,给人们带来了更多智能行车体验;顺丰科技结合KubeEdge构建物料和供应链领域泛生产要素物联网技术应用,让物流更为智能和便民…… </p><p><img src="/img/bVc2RHG" alt="image.png" title="image.png"><br> ▲北京邮电大学将KubeEdge集成至卫星计算平台,使得卫星在太空中首次可同时调用边缘和中心云的资源并具备AI能力和多任务处理能力 </p><p>时至今日,KubeEdge在交通、能源、通信、金融、工业制造、CDN、智慧园区等各行各业已经有了更加深广的应用和普惠价值。 </p><p>回顾KubeEdge的发展历程,王泽锋印象最深刻的,是自己亲手创建的开源项目成功解决了现实中业界重大课题后的喜悦心情。当项目的意义从初期的“与人分享代码”,逐渐走到“与他人共同推动世界向前进步”,每一位从业者都能发自心底感受到开源的巨大魅力。 </p><p>能收获这样的感受,王泽锋付出了很多。</p><h2><strong>开拓国内Kubernetes开源生态</strong></h2><p>2014的云原生技术圈,正处于容器编排技术蓬勃发展的关键期。彼时的Kubernetes刚刚开源不久,得益于Google Borg系统的优良基因,凭借灵活的架构、声明式API等先进的理念,受到了华为容器团队的青睐,并将其集成到PaaS平台中。 </p><p>在帮助客户进行平台迁移的过程中,王泽锋识别到许多Kubernetes的能力不足,包括复杂应用编排调度、故障迁移策略、网络多平面隔离、大规模下的service性能等。基于Upstream first的理念,王泽锋开始到Kubernetes上游社区贡献,也因此开始了他的开源旅程。 </p><p>2015年,王泽锋成为了国内最早的Kubernetes maintainer之一。2015-2018年期间,王泽锋主导了Kubernetes社区的多个关键特性和子项目的设计研发工作,包括: <br>· nodeAffinity - 应用多区域高可用的节点亲和性<br>· podAffinity - Pod间亲和性调度特性<br>· taint-toleration - 应用故障迁移特性<br>· IPVS-proxy - 大规模场景下海量微服务支持特性· Kubernetes Federation - 集群联邦子项目(即后来的Kubefed)<br>· Poseidon - 调度子项目<br>· cluster-api-provider-openstack - 集群部署子项目 </p><p>这些改进不仅得到了社区的积极回应,并且在社区完成开发后被大量企业用户在生产环境中广泛使用,业务价值显著。 </p><p>在此过程中,华为公司在Kubernetes社区中的影响力与日俱增。随着Kubernetes成为云原生产业的事实标准之一,王泽锋与华为公司的成果让更多同行看到了深度参与开源事业的意义和价值。中国企业选择及早参与创新开源项目的行为,让中国开源贡献者在国际上的影响力大大增加。与“搭便车”的做法相比,坚持回馈上游社区无疑更有长远价值。 </p><p>而回到起点,提及为什么会选择探索和开拓这条充满挑战的路线,这要从早期国内外的开源环境说起。过去,国内软件行业对国际开源项目的态度更多是学习借鉴或者直接使用,与上游社区的互动和回馈较少,这种策略更适合于成熟的技术和项目,可以摘取现成的果实,这样的氛围似乎很适合早期的国内市场需求,因此很少有人反其道而行之;但对于处在早期或者快速发展中的项目并不能带来多少帮助,从长远看并不是可持续的健康生态。 </p><p>凭借敏锐的洞察力,王泽锋很早就意识到Kubernetes对云原生产业的重大意义。他知道,在开源社区的促进下,Kubernetes很快会成为云原生技术领域的关键底层支撑。但如果只是一味等待项目成熟坐享其成,是难以在Kubernetes未来的发展道路上取得话语权。为了长期共同发展,必须深入参与社区建设中。 </p><p>王泽锋开始参与Kubernetes开源社区的贡献工作后,对开源世界的生态环境有了愈加深刻的认识:参与开源贡献不仅是单纯的付出,而是一种互利共赢的良性生态行为。基于这种认识,王泽锋在华为内部组建了专门的开源工作团队,成为Kubernetes开源社区在国内的第一批企业化贡献力量之一。 </p><h2><strong>以开源成果创造社会价值</strong></h2><p>把项目代码放到公开仓库,就是开源了吗?王泽锋显然不这么认为。 </p><p>在Kubernetes社区中逐渐积累起影响力后,王泽锋将目标转向了更广泛行业场景应用实践。2018 年,在帮助客户于边缘构建商业应用的过程中,王泽锋与同事联合创立了KubeEdge开源项目,并捐赠到CNCF基金会遵循开放社区的治理模式。</p><p>KubeEdge也因此成为CNCF第一个将云原生技术应用到边缘计算的开源项目。KubeEdge的宗旨是结合云原生技术与边缘计算理念,帮助工业互联网、IoT、智慧交通、智慧能源等行业享受到云原生繁荣生态的种种好处,以及开源社区带来的各种便利。 </p><p>在KubeEdge项目外,王泽锋还发起了Volcano和Karmada两个云原生开源项目,分别用于AI、大数据、高性能计算的基础设施管理需求,以及大规模云原生集群的多云编排需求。如今,Volcano已经在很多互联网、金融、科研机构的数据分析场景中发光发热,Karmada也得到了越来越多海内外企业的关注和应用。 </p><p>与此同时,这些开源项目的社会成果也让项目本身得到了开源社区的更多关注。越来越多企业与技术人参与到了项目的后续发展中,生产实践与社区贡献共同为项目提供动力,形成了一种充满活力的良性循环。 </p><h2><strong>开源社区需要建立良性循环</strong></h2><p>问渠那得清如许,为有源头活水来。</p><p>如果把开源项目比作一个个池塘,来自社区的贡献就像源头的活水,而池塘中养育的水草游鱼则是从项目中受益的各利益方。一如池塘的生态环境一样,开源社区也需要建立同样的良性循环。 </p><p>王泽锋非常明白这个道理。在开源行业倾注热情的这些年,他一直在努力推动社区建立这样的氛围和生态体系。 </p><p>KubeEdge项目诞生之前,边缘计算产业的软件标准化程度还比较低下。很多终端用户受困于厂商和许可证绑定的问题,需要支付高额授权费用才能完成生产线智能化、创新应用开发等目标;如果技术更新换代,前期投入就会变成高昂的沉没成本。这一现状无疑是不利于大环境的创新步伐的。 </p><p>回顾当时的探索道路,王泽锋这样总结: </p><blockquote>我们希望能够复现云原生早期发展的状态,让所有用户都能享受到开源的便利性。我们希望大家可以无门槛获取最前沿技术,在自己的环境中尝试各种各样的业务创新。另一方面,我们也希望凝聚业界最强的力量,大家一起来推动整个行业的创新和迭代进步。在未来,等到市场空间足够大,足够标准化之后,我们相信所有的商业公司都可以有平等的商业变现机遇。 </blockquote><p>正是在这样的理念推动下,华为云先后将KubeEdge、Volcano和Karmada三大项目开源,填补了云原生技术在相关领域的技术空白。而社区的开放性也大大提升了这几个项目本身的活跃度,很多企业开始将它们用于生产环境,反过来也不断向社区回馈贡献。随着越来越多的商用落地案例涌现出来,越来越多的企业通过这些项目取得了业务成功。例如,德国某地轨道交通系统的设施管理、某初创企业的云机器人平台、中海油的油田设施智能化等众多行业项目对KubeEdge的选用, Volcano在中科类脑OS[5]、锐天离线计算集群[6]、小红书大规模机器学习平台[7]等案例中的功能体现,Karmada在VIPKID容器体系设计[8]、艾莫尔人工智能研究院[9]等企业、项目中的落地。</p><p><img src="/img/bVc2RIu" alt="image.png" title="image.png"><br> ▲中海油在智能油田建设项目中部署智能边缘计算平台 图/央视新闻客户端 </p><p>这些实践案例充分印证了开源的一大魅力,就是很多用户可以使用开源项目进行自助技术可行性验证。开源社区每天都在发生着各种令人意想不到的行业实验和落地创新过程,这是开源事业最激动人心的画面,也是让更多潜在用户相信社区的开放与包容,相信自身可以平等地参与制定社区的发展路线的力量所在。社区和用户的双向奔赴,才能真正激发社区生态的原生活力。 </p><p>最终,王泽锋为他的池塘找到了那一汪活水。</p><h2><strong>对开源事业充满热情</strong></h2><p>在早期参与Kubernetes社区建设的过程中,王泽锋有机会与当时谷歌公司一位首席架构师——Kubernetes社区最资深的技术领袖——Brian Grant坐下来一同探讨技术方案,交流各自的技术见解。 </p><p>令他印象深刻的是,Brian Grant作为功成名就的行业前辈,依旧对技术充满热情,对热心开源事业的后辈满怀耐心和期待。 </p><p>王泽锋相信,这样的热情才是开源事业得以持续前进,不断为社会创造价值的动力源泉。而他自己,也秉承这一理念,以饱满的精气神不断努力直到今天。如今,很多开源社区活动都能看到王泽锋的身影,在演讲布道之余他总是会热情解答与会者的问题,帮助开源新人了解社区的工作模式、项目的技术理念,并更快找到问题的解决方案。在王泽锋的引领下,20多位来自各个组织的开发者,在CNCF的众多项目中,成长为业务骨干、核心开发者,这是一种技术分享,更是一种开源精神传承,个人贡献不可估量[10]。 </p><p>而这些优质的项目领导者,如今也正在各个领域发挥领导作用。技术到生产,在业务的深入落实和企业服务层面,王泽锋参与发起的云原生交流平台“创原会” [11] 企业会员已经覆盖各行各业关键领域,通过探索前沿云原生技术,共享产业落地实践,共创云原生与业务融合的无限可能。 </p><p>开源是来自时代的声音, 在开源布道这条道路上,王泽锋也从未停歇。 </p><p>2018 年,王泽锋发起了“Cloud Native Days China”系列Meetup和“Cloud Native Lives”系列网络研讨会,为开发者们搭建更加多元的交流平台。值得一提的是,这类活动会特别注意覆盖到很多二三线城市,帮助那里的开发者了解学习前沿技术。 </p><p>2020 年疫情爆发后,中国KubeCon大会被迫取消,给整个云原生开源社区带来重大损失。为此,王泽锋牵头联系国内的开源爱好者与CNCF共同组织了Cloud Native + Open Source Virtual Summit 2020,以线上会议的形式吸引了大批技术人参会交流,有效弥补了KubeCon暂停的缺憾。 </p><p>2021年,王泽锋作为CNCF大使与社区的成员一起首次将Kubernetes Community Days(KCD)[12]引入国内,促进云原生技术在不同行业的最终用户进行更广泛的传播。</p><p><img src="/img/bVc2RIN" alt="image.png" title="image.png"><br> ▲开源活动中的王泽锋。2018年起,持续开展系列线上/线下峰会、活动、课程,线下足迹遍及北京、上海、广州、深圳、厦门、成都、武汉、南京、重庆及其它城市 </p><p>与此同时,王泽锋还非常重视对开源新人的培养。过去,高校学生主要通过课堂学习来了解计算机技术、接触编程语言等等;而今天,随着开源社区的活跃壮大,高校学生拥有了更多机会去参与开源社区的各种活动,与社区一同成长,甚至直接参与前沿项目的开发,将这种活动作为课业学习的补充,在作出技术贡献的同时,参与者也能够快速熟悉社区协作机制、了解前沿技术理念,在短时间内提升自身的技术能力。 </p><p>系列活动的发起,正是王泽锋对开源布道的一份坚持。目前“Cloud Native Days China”系列meetup、“Cloud Native Lives”、KubeEdge Summit等业内活动,已经影响了超过一百万开发者关注、学习、运用云原生技术。他坚信,开源是实践出真知的世界,亲身参与体验的重要性远远大于枯燥的理论宣讲。 </p><p>越来越多的开源新人正在跟随王泽锋的脚步,怀揣着梦想投入开源事业。先行者的开拓让他们看到了技术与热情对社区的重要性,也让他们逐渐领略到了开源事业的价值。 </p><p>开源最令人激动的地方就在于可以汇聚全球最顶尖的开发者一起在开源社区去解决难题,围绕未知的领域探索、进步。 每一位技术人都有着通过技术改变世界的伟大理想,而开源社区充满热情的氛围让无数像王泽锋一样的技术人找到了实现理想的路径,让分散在全球各地的知己同行能够共同为社会创造前所未有的成果与创新。 </p><p>这,就是开源的魅力所在。 </p><blockquote><h3>引用链接</h3><p>[1] KubeEdge云原生边缘计算框架: <a href="https://link.segmentfault.com/?enc=cZfKb5HmRJ4jm5xyBNNLGA%3D%3D.lw3X011zgd3x0yCn6G0MyydELiTMn1lBYTgV16Avnek%3D" rel="nofollow">https://kubeedge.io</a><br>[2] Volcano云原生批量计算平台 : <a href="https://link.segmentfault.com/?enc=Wf%2FBqPMkVhsDhwlToFYIOw%3D%3D.3kRmflJUuQ9XRJEua%2FxM6qqSErrYboSvVWXPWEGJiho%3D" rel="nofollow">https://vocano.sh</a><br>[3] Karmada多云多集群容器编排引擎:<a href="https://link.segmentfault.com/?enc=EcnasqJqisKq%2BizPlU4tLQ%3D%3D.LmlbrLbbaxEI%2FeYa%2B1Vz98jqjiVS52FH%2FFa2WXf%2Bxiw%3D" rel="nofollow">https://karmada.io</a><br>[4] 首次!在太空验证成功!<a href="https://link.segmentfault.com/?enc=rtJd8NZP8fOr1X0tGsD5Qw%3D%3D.yWiXLv6hNFwE3rSb8GBK29EwLP%2F9b6spZJ%2ByzxIY9nxz9VYim5TxFxY2m2DHTB9U74mQSJ%2Bt1tFsnJR0rVe42Q%3D%3D" rel="nofollow">https://mp.weixin.qq.com/s/OY...</a><br>[5] Volcano在中科类脑云OS中的落地实践:<a href="https://link.segmentfault.com/?enc=gxReYXw5TUkfneoftJPv2Q%3D%3D.RcL%2FeGImvhsNCmSc9szoc7MUudIGa84ZP1UrmKoq7%2BIkd4PO1647QlEKq8tO%2FsYORHWZvlspF7%2FpMgsbJ7wlnQ%3D%3D" rel="nofollow">https://mp.weixin.qq.com/s/ME...</a><br>[6] 基于Volcano 的锐天离线高性能计算最佳实践:<a href="https://link.segmentfault.com/?enc=rLE%2BfB38M9FmYaaLLrBcAQ%3D%3D.LmgwPdY%2Bu61SzCyCS7%2BAh7JlkW1QfgpeR73zRjEfizutcf0shn4s5vodGvWWlsIUPNn30ogDI0pEK3GmPnpy6g%3D%3D" rel="nofollow">https://mp.weixin.qq.com/s/Ek...</a><br>[7] 基于Volcano的大规模离线与在线推荐模型训练实践:<a href="https://link.segmentfault.com/?enc=ZVahz2IqpdIXthRDP8fkKQ%3D%3D.M%2FEZ%2FjachS7kP4KItKq6q6r5gVF6HTrFwBiQLAUYjvB2kI9ClCf19awfn8J3NzCm" rel="nofollow">https://my.oschina.net/LFAPAC...</a><br>[8] VIPKID基于Karmada的容器PaaS平台落地实践:<a href="https://link.segmentfault.com/?enc=%2FT4BG0%2BR8NN1b84UuQWt8w%3D%3D.poBKM26gzGRG2tsbzXSeO4Y9%2BwiaiwzWjsTcFijFJRlYB6jjWI5OKrGXns8ZMG5Be8uy3LfxY2jie9rol0q7bg%3D%3D" rel="nofollow">https://mp.weixin.qq.com/s/fb...</a><br>[9] Karmada in AIML INSTITUTE:<a href="https://link.segmentfault.com/?enc=CgctgzUsuAdUwI8C5MSP5A%3D%3D.meIXooe0GIaH25rTYJTL6c%2FdUlOXI6pOUbDrSMDkj3%2FB5j0c%2Fn5uIrTk%2Fj7MUpm14UBmx%2BqyW734RR9oI%2Fbmsg%3D%3D" rel="nofollow">https://www.cncf.io/blog/2022...</a><br>[10] CNCF TOC 实录:<a href="https://link.segmentfault.com/?enc=mQhViGfb9SMjF5NHAh2u3Q%3D%3D.dN5uif5JzTdG2%2FlolmdZ%2FHNC0WCQHxNiq95gz7lfz2kZxlkIp%2B5OkYj2ZVyFOnY4cfj6a8mxfM98P2kf8Kx037tS68rIyPuntTeFWkvZzhxrfQPmSSD0f1xS09U%2FpYzN" rel="nofollow">https://www.cncf.io/blog/2021...</a><br>[11] 创原会云原生交流平台:www.cnec.io<br>[12] Kubernetes Community Days: <a href="https://link.segmentfault.com/?enc=RymKnMQnHRwBnIRt%2FqTN%2Fg%3D%3D.LwlTeNdVxGDBULbFe4qHcKCkItgl83AlMQecux%2FbfYH6FcFZan6j5eJ%2FRn1z%2B7GWe6bhSjVFCsegfyUH7EC6iA%3D%3D" rel="nofollow">https://mp.weixin.qq.com/s/hh...</a></p></blockquote>Doris 毕业成为 Apache 顶级项目,独家专访百度 PALO 团队https://segmentfault.com/a/11900000419955522022-06-17T05:08:00+08:002022-06-17T05:08:00+08:00思否编辑部https://segmentfault.com/u/writers7<blockquote>采访整理:SegmentFault 思否<br>采访嘉宾:百度 PALO 团队(杨政国、缪翎、李昊鹏、朱小力、龚政、张志强、仲毅、张东进等)</blockquote><p>2022 年 6 月 16 日,Apache 软件基金会发表博文,宣布 Doris 正式毕业,正式成为 Apache 顶级项目(TLP)。(相关阅读:<a href="https://link.segmentfault.com/?enc=gLhE011a2DWZKCNClY5rQg%3D%3D.Di3WaZ7vVtu%2Bxhn7xn1bvYMJwzuJ2NfQLO70Z1dYLfyYvD4HQSUrlyv5qn00mpdhyncJ8XmrhVS93ujuyXM8JGRqwXzH57QODJdWF676tUO%2FHLy%2BaiLXP1QkDAiLScqv" rel="nofollow">https://blogs.apache.org/foundation/entry/the-apache-software-foundation-announces81</a>)。</p><p><img src="/img/bVc0ncf" alt="" title=""></p><p>从 2008 年诞生到今天,Doris 已经走过了十四个年头。这十四年间,Doris 经历了诞生、推广、发展、开源、捐赠、繁荣,成长的旅程中也历经了诸多艰辛和波折。</p><p>SegmentFault 思否独家专访了百度 PALO 团队,为你呈现这背后不为人知的故事与曲折。</p><p>以下内容整理自访谈实录。</p><h2>为数据分析而生,Doris 的“前世今生”</h2><p><strong>SegmentFault:回顾 Doris 14 年发展史,Doris 的都经历了哪几个项目里程碑?</strong></p><p><strong>百度 PALO 团队</strong>:说起 Doris 的历史,它最初诞生于百度,目的是解决当时百度内部高并发,高实时的在线报表需求,不觉间 Doris 已经走过了十四年。</p><p>•2008 年,Doris 在百度诞生,定位为高性能分析型数据库,大幅提升了百度凤巢业务的数据分析时效性。<br>•2009 年,Doris 开始支持百度内部其他报表系统,并助力百度统计成为国内领先的中文网站分析工具。<br>•2012 年,Doris 成长为百度首个公司级 OLAP 分析平台并正式改名 PALO(OLAP 的反写)。<br>•2013 年,PALO 升级新一代 MPP 分布式架构及高性能数据模型,各项核心技术指标大幅提升。<br>•2017 年,PALO 正式对外开源。<br>•<strong>2018 年,百度将 PALO 的核心引擎捐赠给 Apache 软件基金会,并命名 Apache Doris,百度 PALO 团队开始全力推进 Doris 社区发展。</strong><br>•2020 年,在百度 PALO 团队与社区伙伴的共同努力下,Apache Doris 社区走上发展快车道。<br>•2021 年,Doris 各项核心能力大幅增强,行业影响力进一步提升,成为中国信通院 2021 年 “OSCAR 尖峰开源项目及社区”,获得“首批可信开源社区共同体(TWOS)” 正式成员认证。<br>•<strong>2022 年,百度正式完成商标捐赠,推进 Apache Doris 完成毕业,成为 Apache 软件基金会顶级项目。</strong></p><hr><p><strong>SegmentFault:我们看到 Doris 曾经改名为 PALO(OLAP的反写),这个背后有着什么特别的寓意吗?</strong></p><p><strong>百度 PALO 团队</strong>:2008 年,诞生之初,在百度内部被命名为 Doris,大约在 2012-2013 年,Doris 进行过一次大的架构改版升级,契合当时定位“解决高并发,高实时的 OLAP 场景”,于是团队将“OLAP”进行反写,“PALO”就此诞生,最终 PALO 也成了百度基于 Apache Doris 构建的商业化数仓产品名字。</p><p>2018 年百度 PALO 团队和百度负责开源的同事一起携手将 PALO 项目捐赠给 Apache 软件基金会(ASF),鉴于品牌及商标等问题的考量,最终把开源项目定名为 Apache Doris,并把 Doris 的品牌和商标一并捐给了 ASF,正式成为 ASF 孵化项目。</p><hr><p><strong>SegmentFault:作为曾经百度内部的高性能分析型数据库,为什么会考虑把产品开源?</strong></p><p><strong>百度 PALO 团队</strong>:Doris 在 13 年设计新版时,已经在百度内部得到了复杂场景和高并发、大压力的验证,我们希望未来能将它开源出去,让更多的人用到并获益,同时希望通过开源的方式加速其成长。所以,在新版设计的时候,我们去掉了百度内部闭源库及内部系统的依赖,让整个系统能够独立、自由运作。<strong>百度 PALO 团队坚信未来基础设施软件必然会走开源路线,只有开源才能保持产品活力和迭代速度。</strong></p><p>开源之初,我们的目标就是将 Doris 建设成为全球最优秀的开源数据仓库之一,所以,我们选择了在 Apache 软件基金会进行开源。众所周知,Apache 软件基金会在大数据领域的项目都极具影响力,比如 Hadoop 和 Spark 等大家耳熟能详的项目。</p><p>从开源到现在,Apache Doris 的 Star 和 Contributor 数量都有了数倍,甚至数十倍的增长,尤其是从 2020 年开始,社区核心指标增长速度明显加快,这也从侧面反应出,外界对 Apache Doris 项目的关注度和认可度在不断增加。</p><p>下图是来自 Star History 的数据,可以看到 Apache Doris 从最初的 240 个 Star,一路走来,到目前 Star 数已经达到 4500 个。从图上也可以看到近两年,增长趋势明显加快。</p><p><img src="/img/bVc0m7F" alt="" title=""></p><p>下图是来自 api7 的数据,可以看到 Apache Doris Contributor 的数量从最初的 10 个左右,增长到现在的 330+,增长趋势也在逐步加快,月度活跃贡献者的数量已经达到 80 个。</p><p><img src="/img/bVc0m7G" alt="" title=""><br><img src="/img/bVc0m7H" alt="" title=""></p><hr><p><strong>SegmentFault:近两年中国开源资本热,在你们看来什么样的软件适合开源,什么样的软件适合闭源发展?</strong></p><p><strong>百度 PALO 团队</strong>:“开源”这两年的确受到了资本热捧,加之国家十四五规划对“开源”的<br>加持,热度一再飙升。尤其是 Doris 所在的赛道,更是被称为“黄金赛道”,这两年前前<br>后后诞生了十几家创业公司,真可谓“雨后春笋,俯拾皆是”。</p><p>“资本”对开源的追捧和青睐,绝对不是因为“情怀”更不是因为“喜好”,他们更关注的是“开源”背后的“商业化”前景。资本对开源的助力,是资源的加持,这个加持可以让开源项目发展更快,产品成熟更早。而基于开源而生的商业化产品才是其真正价值所在,要想持续得到资本“青睐”,开源背后的商业化产品,一定要切中付费用户的需求和痛点,做出跟开源产品的差异化特色和竞争力,且要保持和开源产品良好的共生关系。</p><p>“开源”讲求的是共建共享,一群人可以走的更远,所以,<strong>我们认为那些“投入大,转化周期长”的产品是比较适合开源的。Apache Doris</strong> 就是在这样的背景下采取了开源路线,也正是通过开源,Doris 项目获得了远超单个公司的投入力度,以及大量用户的使用和打磨,最终,也使得 Doris 的产品力和影响力得到了长足的发展。</p><hr><p><strong>SegmentFault:从内部工具到极速简用的 MPP 开源数据库,在产品层面 Doris 经历了怎样的变化?</strong></p><p><strong>百度 PALO 团队</strong>:Doris 的产品定位叫做“为数据分析而生”,Doris 在产品层面的变化<br>是伴随着数据分析的场景变化而一起演进的,经历了四个发展阶段:</p><p><strong>第一阶段是商业智能分析</strong>,注重通过数据来对业务进行描述与分析,这也是 Doris 诞生的阶段。2008 年,Doris 在百度凤巢诞生,本身就是为了解决报表问题,到了 2012 年,Doris 已经成为百度的首个公司级 OLAP 平台,承接整个公司的报表需求;</p><p><strong>第二阶段是海量数据分析</strong>,也就是在企业信息化和数字化普及之后,数据量大幅增加,数据库要能够处理相比之前十倍百倍的数据。2013 年,Doris 完成了 MPP 引擎改造,利用分布式能力,大幅度提升数据处理能力与效率,所能处理的数据量级提升到 TB 至 PB 级别,查询时效性也有了一定提升;</p><p><strong>第三阶段是实时数据分析</strong>,在这一阶段中,企业更加注重实时性和预测性分析,期望在海量数据下加速传统 T+1 模式的分析效率,获得分钟级甚至秒级的分析能力,这也正是近些年来 Doris 所解决的用户核心痛点。自 2017 年开源至今,Doris 通过对存储引擎、查询引擎、查询优化器等各个核心模块的优化,不断增强性能表现,尤其是近期的向量化引擎,更是把性能全面加速了 5-10 倍,真正实现海量数据下的毫秒级查询体验;</p><p><strong>第四阶段是全民数据分析</strong>,在这一阶段中,数据分析不再是数仓维护人员和数据分析师的“专利”,企业中的许多角色都有着自主数据分析的需求和能力,所有人都期望能够快速地分析、使用数据,获取价值,这也是当前 Doris 正在处理和应对的需求:一方面在查询性能方面, Doris 要能够支持更高并发与吞吐,提供更加多样化的查询能力,以应对企业“全民数据分析”的场景需求;另一方面,Doris 更要提供低成本、低门槛的查询分析手段,比如进一步提升自运维能力,提供开箱即用的数据分析体验,帮助用户更加关注业务与数据本身,而无需耗费过多精力在系统底层的部署运维工作。这一点在百度的商业版本 Palo 中有着更多体现,我们充分利用云的弹性能力和容器化能力,为用户提供近乎于 0 运维成本的集群托管服务,不论是存储计算资源扩缩容,还是云原生化的监控调优能力,都在帮助用户以极低地成本与门槛,向全民分析时代飞速跃进。</p><h2>木桶效应,Doris 强在每一块木板都很均衡</h2><p><strong>SegmentFault:Doris 在性能,功能丰富度和易用性上表现都非常出色,那么在您看来 Doris 最强的竞争力是什么?</strong></p><p><strong>百度 PALO 团队</strong>:Apache Doris 最强的竞争力在于能够适应全场景的业务需求,无论是聚合、明细、Ad-Hoc、单表、多表等各种数据分析的场景,Doris 都能比较好的支持。其次 Doris 在性能,功能丰富度和易用性上表现都非常出色,在性能上 Doris 经过多年打磨,在各类场景都有极佳的性能表现,尤其是近期向量化版本上线之后,性能又有了数倍的提升。</p><p>Doris 集群能够非常方便地实现动态扩缩容,当节点出现故障时数据自动迁移,这些都不依赖外部系统,也不会影响上层业务系统,集群运维非常简单。另外 Doris 支持非常丰富的标准 SQL 语法,能够完成各类复杂查询任务。除了传统的 AP 场景外,Doris 也提供高性能流式写入能力及在线高并发访问能力,可构建现代 HSAP 架构的数据服务。因此 Doris 是一个非常全面、成熟和易用的系统,就像一个木桶,Doris 的每个一块木板都很均衡,装的水自然比较多。</p><hr><p><strong>SegmentFault:常常有人讨论性能与易用性的孰轻孰重,Doris 是如何平衡性能与易用性的关系的?</strong></p><p><strong>百度 PALO 团队</strong>:性能是 Apache Doris 内核最重要的指标之一,也是业界对数据库类产品进行评价的重要标准。所以,Doris 对性能的追逐一直没有停止过,我们正在持续研发的向量化执行引擎和新的优化器都是性能提升的重要手段。同时简单、易用以及稳定、可靠都是 Doris 持续关注的重点,Doris 通过极简的运维和丰富的功能被大家熟知和认可。</p><p><strong>极致的性能可以帮用户应对复杂而苛刻的业务场景;简单、易用可以让整个系统搭建成本更低,运维更高效。</strong>所以性能和易用性二者并不冲突,更不是相互对立,我们在内核层面追求极致的性能,并不影响我们在通过精巧的设计,将简单好用的功能提供给用户,我们会在用户能够感知的地方做大量的工作,使每一个特性都能满足不同层次用户的需求。</p><hr><p><strong>SegmentFault:目前 Doris 最核心解决了客户的哪些问题?比较常见应用场景是什么?有没有成熟的商业用例?</strong></p><p><strong>百度 PALO 团队</strong>:Doris 最核心地解决了客户对于海量数据的高时效性分析需求,Doris 通过自身产品能力的建设,在数据分析环节做到了性能更加高效、功能更加全面、运维更加简单、生态更加丰富。</p><p>结合以往的经验,我们总结了 Doris 的四大应用场景:</p><p>•传统数仓加速:在原有的传统的单机式数据库或者离线数据仓库基础上,增加高性能分析型数据库能力,加速传统数仓的查询能力。<br>•实时数仓构建:构建以实时数据为主的数据仓库,支持端到端的实时数据分析,包括高时效的实时数据写入与高性能的实时数据分析。<br>•多源联邦查询:提供跨多数据源的统一查询入口,以统一的一站式查询能力满足业务人员多元化的查询需求。<br>•交互式数据分析及在线数据服务:提供高并发与高时效的在线查询体验,以极低的建设成本,高效的支持业务侧报表、大屏或即席查询等需求。</p><p><strong>百度基于 ApacheDoris 所构建的商业化数据仓库产品 Palo 自 2017 年对外提供服务以来,在各行业均有落地实践,积累了大量商业用例。</strong></p><p>截至目前,已有近百家企业在使用 Palo 商业服务。比如我们在某头部金融支付公司项目中,重点加强建设了 Palo 的多租户能力,满足企业各省、市子公司的数据与资源隔离需求;在某头部声学元件制造商项目中,充分利用了 Palo 在时序性数据方面的写入和查询能力,支持生产车间的设备数据分析与监控;在与某互联网头部问答社区的合作中,我们针对客户的广告与画像需求,对 bitmap 及相关用法做了重点优化,为客户内容数据中台建设提供了极大支持。</p><hr><p><strong>SegmentFault:近两年也有一些基于 ApacheDoris 的外部的商业公司开始崭露头角,PALO 团队怎么看开源和商业的关系?又怎样看待这之间的竞争与合作?</strong></p><p><strong>百度 PALO 团队</strong>:我们很高兴的看到有越来越多的公司开始参与 Apache Doris 项目的建设,这说明项目得到了用户、社区和资本市场的认可,可见,最初我们将 Doris 捐赠给 Apache 软件基金会是非常正确的选择。未来,随着社区的持续发展,<strong>我们希望还会有越来越多的公司能够加入,跟百度 PALO 携手共建一个繁荣和强大的开源软件生态</strong>。</p><p>当然,我们也看到,过去确实有一些商业驱动的不良行为对社区带来了损害。因此,作为 Apache Doris 的主创团队,我们会坚定的维护好社区的秩序,确保社区的参与者都能够遵守 Apache Way 行为规范,从而促进社区的健康可持续发展。</p><p>当前,大量底层技术产品都采用开源模式,客户也越来越认可开源的模式,“是否开源”正在成为很多客户进行商业决策的重要依据;另一方面,开源社区能够帮助我们构建坚实的用户基础,以及广泛和正面的品牌认知,从而促进我们商业化的发展。<strong>所以,对于未来的技术产品,开源可能成为必须,这个“必须”不一定损害商业模式,反而会促进商业上的成功</strong>。</p><h2>在“大厂”做开源,收获更多的是“诗”和“远方”</h2><p><strong>SegmentFault:Doris 从捐赠、孵化到毕业也经历了接近4年的时间,在这期间团队有没有遇到过一些困难,是如何解决的?对于刚刚开源还在孵化中的项目有没有一些建议?</strong></p><p><strong>百度 PALO 团队</strong>:Apache Doris 从捐赠到今天顺利毕业已经接近 4 年,这期间的确遇到了非常多的曲折,在这里着重跟大家分享几点。</p><p><strong>一是团队内部价值呈现和资源冲突的问题。</strong>开源让 Doris 项目得到了快速发展,同时也给团队带来了额外工作量,团队需要维护两套代码(开源产品 Doris 和商业化产品 Palo),团队需要平衡在两个产品上的投入力度,同时还要跟公司讲清楚这两部分工作的价值及关系,直接地、间接地、甚至是隐藏在背后的无形价值。</p><p>其实这个问题的解决,最重要的是团队对于“收益”的重新定义,开源的收获,不止是反馈到绩效和晋升上,他也会帮助团队构建在社区乃至行业中的影响力。这个过程带来的成长,要比在一个公司中开发闭源产品来的更快、更多——正所谓:“海阔凭鱼跃,天高任鸟飞”,<strong>开源给团队带来了“海”和“天”。</strong></p><p>在做好开源的同时,团队也要规划好商业产品的发展,给公司带来商业收益,并且要把开源对商业化的正向作用向公司呈现,这样就会持续得到公司的支持,形成正循环。</p><p><strong>第二个困难是由于没有经验,我们走了一些弯路。</strong>最初大家对开源的认知有限,一开始什么都缺,什么都要从头开始摸索,包括物料准备,包括意识和经验的积累,都是跌跌撞撞,一步步摸索过来的。从 Apache Doris 官网的建设,到官方公众号的运营,再到渠道生态体系的构建,以及开源和商业化关系的梳理等等,我们经历了诸多艰辛与挑战,还好大家一起坚持下来了。</p><p>前期我们在内容建设上,稍不留神,就容易越过“开源”的界限,掺杂“商业化”气息,还好有 Apache 导师随时帮我们指出问题,及时纠正。</p><p>这一点,我们团队给出的建议是,项目一开始就想清楚团队搞开源的最终目的是什么,“以终为始”,这样路径执行上就不会有太多摇摆,资源投入也不会断档。同时要把开源和商业化严格区分开来(包括产品形态和运营模式),尽量在社区中不要掺杂私心,多跟项目导师沟通,他们有经验,而且比较中立,听他们的,不会错。</p><p><strong>第三个困难是一些外部商业因素对项目的干扰。</strong>作为一个 Apache 的开源项目,Doris 并不排斥商业公司的使用和参与,然而,一些纯商业利益驱动的不良行为并不符合 Apache Way,会对社区带来损害。因此,对于正在考虑开源孵化的项目,前期除了选好协议及孵化组织外,我们建议还要做好对于项目名字和品牌的保护。像商标注册之类的工作一定要做在前面,如果在孵化过程中遇到侵权等问题,要及时跟项目导师和公司法务沟通,必要时要动用法律手段,以保护社区的健康发展。</p><hr><p><strong>SegmentFault:你们如何理解 Apache Way 的?</strong></p><p><strong>百度 PALO 团队</strong>:关于对 The Apache Way 的理解,可以参考 Sally 老师在 Apache 软件基金会官方微博的一篇文章,有兴趣的可以直接读一下原文:</p><p><a href="https://link.segmentfault.com/?enc=i973CmPS9S0xmFNiczSd0A%3D%3D.qs6c4mwCWw2PrLuDAQOm%2BF1AOfaoDX7pCKF0yrSrAa9lv3tdq0%2BULMfYu29qaBW8bz85kfSoEeq%2Blt%2FlKIgzM8C5%2BtjimEcLAYLSwW9m2nA%3D" rel="nofollow">https://blogs.apache.org/foun...</a></p><p>Apache 软件基金会工作的重点,不是生产软件,而是指导产出软件的社区,这个指导方法我们可以理解为就是 Apache Way,它是在实践中不断完善和成长的开源社区发展指导手册,有了它个人或者组织就可以了解大规模开源软件如何在激烈的竞争市场中进行良好运作。</p><p><strong>The Apache Way 的核心原则是“社区大于代码”</strong>,它更多强调的是“人”,是“生态”,健康的社区才能孕育优秀的代码,毕竟人才是核心生产力,有了遵从规则的优秀开发者,不愁没有优秀的代码产出。一个健康的社区总能纠正代码的问题,而一个不健康的社区难以保持代码库的正常维护,而 Apache Way 就是保护一个社区在 20 年后还能健康繁荣的“法律框架”,违背它就要接受“惩罚”。</p><p>Apache Way 是完全包容、开放、透明和基于共识的。它确保来自商业公司的参与者中立,以防止来自单个公司的不当影响(或控制)。它确保任何具有宝贵贡献的个人都有权获得授权,并且尽管社区成员资格随着时间的推移不可避免地发生变化,但它仍会确保项目有可持续性。</p><h2>毕业成为顶级项目,ApacheDoris 驶向星辰大海</h2><p><strong>SegmentFault:从 Apache 孵化器毕业意味着,Apache Doris 将开始新的征程,展望未来,Doris 有怎样的发展规划(社区、产品、商业)?</strong></p><p><strong>百度 PALO 团队</strong>:毕业意味着新的开始,也意味着新的责任,我们将一如既往地全力支持和贡献社区,把我们在实践中所收获的产品能力与社区分享,与社区的小伙伴一道将 ApacheDoris 建设的更加完善,也让更多人能体验到 Doris 的优秀能力。</p><p><strong>在产品技术方面</strong>,我们将持续打磨 Doris 的核心能力,保持核心技术指标的领先。其中,在性能方面,我们将全方位的打磨或重构现有的查询层、执行层和存储层等核心组件,尤其是社区呼声最高的向量化和优化器,我们将实现完全的面向列的向量化执行引擎,全面淘汰行存,同时,我们将实现全新的 CBO 优化器以及更加精细和丰富的统计信息,这将把 Doris 的性能进一步推向极致。在稳定性和可观测性方面,我们将重点补齐 Doris 的短板,强化 Doris 的 Profiling、Trouble Shooting、细粒度的资源监测和管控等能力,我们也将会持续将我们在大规模生产环境所遇到的各种稳定性问题及解决方案贡献到社区,进而帮助Doris变得更加稳定。我们也将持续完善 Doris 的各项重要功能以及生态对接能力,其中就包括对复杂类型的内置支持、UDF/UDAF 的优化、Hadoop/Spark 生态圈对接能力完善、数据湖和联邦查询能力的强化、管控平台的完善等社区呼声最高的功能,从而帮助 Doris 变得更加强大和易用。除此之外,Doris 仍然有很多值得完善的地方,我们十分愿意倾听用户的心声,并欢迎大家多提 issues,与我们一道帮助 Doris 发展的更好。</p><p><strong>在社区建设方面</strong>,Apache Doris 已经度过了早期萌芽阶段,正在进入高速发展期。一方面,我们要进一步强化社区的运营投入,让 Doris 能被更多的贡献者、开发者以及用户等所知道,努力构建一个多元、繁荣和国际化的社区;另一方面,随着社区的扩张,以及商业诉求的增长,我们将建立或完善社区的各项规章制度和行为准则,让各方都能在 Apache Way 的指导下参与社区,保障 Doris 社区能够良性和健康的发展。</p><p><strong>在商业方面</strong>,我们也在围绕 Apache Doris 持续完善我们的商业产品“PALO 数据仓库”。相比开源的 Doris 引擎,PALO 数据仓库将提供大规模生产级的稳定性、完善的企业级特性、易用的管控和访问平台、无感升级等专有特性,用户也将享受到来自原厂资深专家的专业技术支持服务。除此之外,我们全新推出的 PALO Cloud 产品将支持先进的多云原生能力,提供完善的云原生,以及多云和跨云能力,帮助用户拥抱云和多云时代。同时,PALO Cloud 的在离线融合、湖仓融合等能力将帮助用户构建以数据为中心的新一代全场景统一湖仓,为企业提供数据的统一视图、统一访问,真正释放数据的价值,正如 PALO 的寓意那样能够“玩转 OLAP”。</p><hr><p>相关阅读:</p><ul><li><a href="https://link.segmentfault.com/?enc=ih6qEM3N2mpM4MNH4aHirw%3D%3D.U%2FUpUZVxX9pBjhnHcWgl7ltA2YWAuweD%2FtowQhbj%2FgMv0qwrbl%2B8FaSXbdhceK85yS3YQ0PdI5Y8cMP2o3g1PhYEmgfNaL%2B4nmHkKE9qo1FCje%2FUV0VB4xn%2FmXtlCV%2Bf" rel="nofollow">The Apache Software Foundation Announces Apache® Doris™ as a Top-Level Project</a></li><li><a href="https://link.segmentfault.com/?enc=025NGydJ79neL8Lv4F2J9Q%3D%3D.U7lOP0lryNPU5eLybU2iobAlZ470DXzfRoQ2Bgd%2FjeA%3D" rel="nofollow">https://doris.apache.org/</a></li><li><a href="https://link.segmentfault.com/?enc=40EnQ7tRczUCWh%2BFh2lqCQ%3D%3D.QioG4ld29iUCU%2BjVtvqBKlvOSsK2rncTsfe9kbGlkkKLTy5UYYTHfqiJwXb%2FDy7F" rel="nofollow">https://github.com/apache/incubator-doris</a></li></ul>专访 MindSpore 黄之鹏:社区治理与商业创新的开源双重奏https://segmentfault.com/a/11900000407862882021-10-09T17:08:12+08:002021-10-09T17:08:12+08:00茕茕码字https://segmentfault.com/u/qiongwrite1<p><img src="/img/bVcVixr" alt="image.png" title="image.png"></p><p><strong>访谈者</strong><strong>:马玮,SegmentFault 思否技术编辑</strong><br><strong>受访者<strong><em><em>:黄之鹏,</em></em></strong>华为昇腾开源生态总监, MindSpore 开源社区运营负责人</strong></p><hr><p>吐槽大会你一定听说过,但你参加过 AI 开源吐槽大会吗?</p><p>一年多前,MindSpore 正式开源,自此之后,各类别出心裁的运营活动 —— 吐槽大会、Women In Tech 层出不穷……</p><p>开发者们不再为 AI 应用开发门槛太高而踌躇,不再被枯燥无味的文档拒之门外,MindSpore 依靠其在深度学习框架领域的积累和形式多样的开发者活动,聚集了一批中国 AI 新生代力量。</p><p>今年的 OSCAR 开源产业大会,也设置了开源社区治理与运营分论坛,在会前我们特别采访了在这一领域极具特点的开源项目代表 ——<strong>华为昇腾开源生态总监, MindSpore 开源社区运营负责人,黄之鹏。</strong></p><h2>深度学习框架正在进入全场景 AI 计算框架新时代</h2><p><strong>思否</strong>:<strong>什么是 MindSpore?</strong><br><strong>黄之鹏</strong>:MindSpore 是华为开源的一款全场景 AI 计算框架,旨在提供友好设计、高效运行、简捷部署的开发体验,目前应用于医疗、金融、科研等多个领域,提供面向端边云多种场景的主流硬件支持,并针对昇腾硬件平台提供深度优化能力。</p><p><strong>思否</strong>:<strong>谈竞争 — 热门的 AI 领域,MindSpore 竞争力何在?</strong><br><strong>黄之鹏</strong>:我们认为应该用发展的眼光看问题,深度学习框架的发展经历了浅层框架时代和通用框架时代,Caffe、Theano 以及 Tensorflow、PyTorch 分别是前后两个时代的典型代表。<strong>深度学习框架目前正在进入以 MindSpore 为代表的全场景 AI 计算框架的新时代</strong>。</p><p>MindSpore 社区将通过开源协作,以社区的力量共同努力解决这个新时代的许多新问题,相信也会有大量的业界专家与新一代开发者会深入地参与到这个伟大的变革之中,成为 MindSpore 生态的主力军。</p><p>MindSpore 自身提供的极佳的 AI+科学计算能力,包括自动微分能力、能够支撑千亿稠密模型的自动并行能力、高阶优化能力、图算融合能力、全场景协同能力、AI 可信能力等等。</p><p>目前开源仅一年多时间,MindSpore 下载量已接近 60 万,2600+ 社区贡献者,服务企业数量超过 5000 家,高校授课、众智、科研合作超过 100 家,ModelZoo 中已有 170+主流网络模型实现。</p><h2>Community>Code:完整运营方法论、立足中国的国际化社区</h2><p><strong>思否</strong>:<strong>作为国内第一个采用开放社区治理的深度学习开源框架,目前社区治理框架是否已经完善?取得了哪些成绩?</strong></p><p><strong>黄之鹏</strong>:开源社区的治理框架同代码一样,也是处于持续的演进之中。</p><p>MindSpore 社区目前对社区治理的理解由三个部分组成:<strong>开放性、可信性、多样性</strong></p><p><strong>开放性</strong>:MindSpore 目前拥有来自欧洲、亚洲、美洲的<strong>14 名技术专家的技术治理委员会(TSC)</strong>,由开发者组织的<strong>兴趣小组(SIG)</strong>和<strong>工作组(WG)</strong>。社区所有组织的会议都要求<strong>公开、透明</strong>,会前有预告会后有录屏,这保证了开发者对 MindSpore 社区的开放性的信任,反过来也推动了 MindSpore 社区的快速成长。</p><p><strong>可信性</strong>:MindSpore 社区积极参与 OSCAR 社区及信通院牵头组织的开源可信工作,分享了社区开发者体验 SIG 的大量优秀实践,成为全国首批获得可信开源社区评估证书中的唯一一个 AI 开源项目,并成为可信开源社区的发起成员之一。</p><p><strong>多样性</strong>:我们在国内和海外,通过组织面向本地开发者、高校师生、上下游企业的社群<strong>MindSpore Study Group</strong>, 将来自不同文化、习俗、族群、专业、行业的 AI 爱好者,都纳入到社区大家庭中。比如最具特色的 MSG·Women In Tech 活动,在北京上海深圳等地都组织了当地女性开发者社区,更好的推动社区对多样性的支持,弘扬包容的社区文化。</p><p><strong>思否</strong>:<strong>看到 MindSpore 举办的线上线下活动皆受到了广泛关注,吐槽大会等创新形式一片好评,有哪些方法论可以和我们分享?</strong></p><p><strong>黄之鹏</strong>:非常感谢对社区运营工作的认可!我们的社区运营工作有一整套的方法论和制度保证。</p><p>在形而上的层面,提出价值框架理论,<strong>以价值主义和框架主义的观点,统领我们的具体工作</strong>;</p><p>在具体实施层面,社区运营工作分为四大层面:<strong>运营平台、社区治理、开源合作以及基础设施</strong>。</p><ul><li>其中运营平台作为重中之重,以模型的思维和产品迭代的思路,打造集品牌营销、内容制作与传播、社群活动、技术培训等服务能力的平台化产品;</li><li>社区治理则通过引入开放治理架构、打造可信开源社区、弘扬性多样性包容文化,来推动开放协作创新;</li><li>开源合作侧重于面向业界现有主流开源社区及基金会的广泛合作,比如与 CNCF 基金会的 Kubeflow 和 Volcano 项目这样的技术合作,也有和开放原子基金会合作的开源运营手册这样把社区运营都开源出来的运营合作;</li><li>基础设施包括大量的 CI 机器人、开发者体验机器人、同步机器人、CI 集群、数据化运营面板的构造。</li></ul><p><img src="/img/bVcVixt" alt="image.png" title="image.png"></p><p><strong>思否</strong><strong>:MindSpore 在国际接轨上如何考虑?在国际化市场中有怎样的战略和策略?</strong></p><p><strong>黄之鹏</strong>:MindSpore 从初始就秉承打造<strong>立足中国的全球化开源社区的理念</strong>,与全世界的深度学习开发者一起构筑生态。我们选择国内的代码托管平台作为主仓正是立足中国的体现,但同时也通过打造实时同步机器人等社区工程化手段,在 GitHub 维护可以进行开发和接受贡献的镜像仓库,方便世界其他地方的开发者参与社区。</p><p><strong>开源社区内生就是国际化的开发者共享、共建、共治的生态圈</strong>,因此不存在特定的国际化战略和国内、国外市场不同策略的概念。但是社区非常重视各个地区在文化上、制度上等方面的特异性,因此社区通过发起面向本地开发者的 MindSpore Study Group 社群,尽可能通过去中心化的自组织行为,繁荣所在地的开发者生态,并合规的开展社区活动。我们也通过与 Eclipse 基金会、Linux 基金会等全球性重量级基金会的合作,在 AICE Lab、LFAI、Confidential Computing Consortium 等领域扩展全球开发者生态。</p><p><strong>思否</strong><strong>:未来一年 MindSpore 在技术和社区上有什么发展规划和目标?</strong></p><p><strong>黄之鹏</strong>:在技术整体层面上,MindSpore 仍然会持续推动全场景 AI 计算框架这个新时代的发展,具体的技术方向上,则会由社区的各个组织,按照 3 个月的版本周期,来依据规章决策和推动。</p><p>MindSpore 开源社区将持续尝试更多有益的尝试,在世界上更多的地方发展我们的开发者生态,并加大制度创新的推动,力争成为最为专业和体系化运作管理的开源社区。</p><h2>开源助力商业成功,商业生态是开源大生态的价值组成</h2><p><strong>思否</strong><strong>:如何看待开源与商业化之间的矛盾与联系?MindSpore 在商业化上目前进展如何?</strong></p><p><strong>黄之鹏</strong>:开源与商业并不存在矛盾,<strong>在微观的层面上,开源运营是助力商业成功的一个有效手段,而在更宏观的层面上,商业生态则是开源大生态的一个不可或缺价值组成部分</strong>。</p><p>MindSpore 目前在最主要的国计民生行业都有很多的解决方案,一些实际案例比如携手宝德打造的 AI 质检一体机方案,与立得空间在高精度地图生产软件方面的合作等等。</p>专访开源之道主创 · 适兕:真实的开源世界依旧冷清https://segmentfault.com/a/11900000407862222021-10-09T17:01:03+08:002021-10-09T17:01:03+08:00茕茕码字https://segmentfault.com/u/qiongwrite1<p><img src="/img/bVcViuG" alt="image.png" title="image.png"></p><p><strong>访谈者</strong><strong>:马玮,SegmentFault 思否技术编辑</strong><br><strong>受访者</strong><strong>:李建盛(适兕)</strong></p><p>作家,开源之道主创,Linux 基金会 APAC 开源布道者,Apache local community Beijing 成员。2020 年被 SegmentFault 思否和开源社评为“中国开源先锋 33 人”之一。</p><hr><p>关注开源的朋友一定对“适兕”这个 ID 并不陌生,他是开源布道师李建盛老师的笔名,活跃在各个社区组织、开源会议和社交网络上。</p><p>作为本次 OSCAR 2021 开源产业大会 “开源文化&开源之商” 分论坛的出品人,李建盛老师在会前接受我们的采访,分享了他的开源之路。</p><h2>十八年开源路和两个重要拐点</h2><p>说起适兕与开源的结缘,还要追溯到大约 18 年前,彼时还在读大学的他偶然接触到一张 RedHat Linux 7.3 的光盘(RedHat Linux 发行版),从此凭借着强烈的兴趣,一发不可收拾,投身到后续 Linux 的相关学习和工作中。看似和很多人开始接触开源的故事类似,技术男、爱折腾、从兴趣出发,但这条路,适兕一走就是 18 年。</p><p>回望适兕的职业历程,大体分成两段 —— 大学毕业后的 11 年,他一直在从事技术研发工作,2016 年至今全职进行开源布道。而想了解适兕的开源生涯,这其中有两个重要拐点不得不提。</p><p>自认学校普通、背景一般的他,大学一毕业便进入了世人眼中收入稳定、社会地位较高的报社,从事系统管理员的工作。然而,从大学时期就开始研究 Linux 的他并不甘于此,工作中一个偶然的机会让他接触到红旗 Linux 发行版,于是适兕开源生涯的<strong>第一个转折点</strong>出现 —— 在与红旗 Linux 售后工程师的一次次深入交流后,适兕<strong>受邀加入红旗 Linux 正式开始从事开源相关工作</strong>。在红旗 Linux 工作几年后,适兕也曾加入过一家创业公司,依旧基于开源技术来做产品。</p><p>然而回看十多年的开发经历,他用了“失败”两个字来形容,而这一切源于和公司管理理念的差异,究其根本在于是否要 Upstream First(上游优先)。适兕一直在公司倡导的上游优先理念,一直未能得到采用,大量重复浪费的工作让他产生了巨大的挫败感,于是在 2015 年,适兕选择启动他<strong>开源生涯的第二段故事 —— 成为开源布道师</strong>。</p><p>第二段故事的开启,源自于 2015 年下半年适兕的一篇文章《为什么基于成功的开源项目的商业产品会失败?》,那时圈内出现了对于开源是否应该商业化的讨论,本着将这一问题阐释清楚的初衷,适兕将自己过去 10 余年的研发经验融入其中,一篇经典文章横空出世,也因此得到了圈内资深人士的转发扩散,受到广泛关注。于适兕而言,这是一个契机,也是一次启发,写了十多年技术博客,适兕开始转型,<strong>“开源之道”</strong>(<a href="https://link.segmentfault.com/?enc=vSfbWhmL4kswflE7rqeJ%2Bg%3D%3D.SD0LSKZ8qfrep%2BAItW%2Bc0br7ctmb3KYBzw%2BoEYJ%2BvwU%3D" rel="nofollow">http://opensourceway.community</a>)<strong>诞生了,他离开研发岗位,开始全职进行开源布道</strong>。他的博客也渐渐与狭义的“计算机技术”没有太大关系,转而围绕开源的社区、商业、文化展开,到现在已有 600-700 余篇文章和评论。</p><p><img src="/img/bVcViuL" alt="image.png" title="image.png"></p><p>做开源将近 20 年,5,6 年时间写 600,700 篇博客,然而当我们和适兕谈起“坚持”二字,他并不认为自己投身开源是一种坚持,却出乎意料地云淡风轻 —— 获得收入、吸取知识、赢得尊重、接触各式各样的朋友,这都是开源给予适兕的宝贵财富。<strong>选择一直在开源的世界中,是因为自认收获 > 付出</strong>,适兕谦逊地说“换个角度来说,其实我的选择并不多。”</p><h2>从工程师到独立开源布道师</h2><p>“Advocate”这一职位此前在外企中较为流行,伴随着开源和开发者服务公司在国内的崛起,国内也慢慢出现类似的职位,人们将其译为“布道师”。那么从工程师到布道师,在适兕看来,什么是布道师?做全职独立布道师 6 年是一种怎样的体验?他又是如何布道的?</p><h3>谈布道,Leadership 和工匠精神</h3><p>在适兕看来,成为布道师核心是两点能力 ——</p><ol><li><strong>对某一事物有深刻见解或远见,有 Leadership</strong>,比如说写《大教堂与集市》的作者 Eric S·Raymond,O'reilly 公司的创始人等,他们具备异于常人的思维和思考方式,而且能把一个事情讲述得非常清楚。</li><li>在开源圈有一个很重要的事情<strong>“工匠精神”(又称“匠人精神”)</strong>指我们会精益求精地去做好一件事。</li></ol><p>当你具备这两个条件的时候,就可以开始去做一些布道的事情了。</p><p><strong>首先你要对自己从事的事情有一个很好的认知,并且相信它</strong>。假如你是某一个开源技术或者某一个项目的布道师,最重要的是,你要对这个项目的方方面面了解清楚,他有哪些功能、解决了什么问题、都有人谁在解决、他们是怎么做决策的等等。</p><p><strong>然后就是表达,你要把要这件事情阐述清楚</strong>。表达和传播的载体和媒介多种多样,比如你可以写文章、著书、评论、制作视频、访谈、制作播客、到大会上进行演讲、和同行交流等等。</p><p>我们所生存的数字化时代是一个加速变化的时代,人的注意力被分割成无数块,只要你想,就可以不断地被吸引,路边的广告、纷纷扰扰的信息 …… 在数字化时代,人类最稀缺的就是注意力,新型的技术利用、各种算法投人所好地去抢占关注点,这个时候布道师是多么的重要。他可以把你做的事情表达清楚,能把意义阐述清楚,然后引人入胜。</p><p>所以在适兕看来,布道师对做任何事情的组织都是非常关键的一个角色,甚至现在这个角色也被技术化,有人通过算法和社交应用数据去做传播。</p><h3>谈独立,自律让我更自由</h3><p>不全职受雇于任何一家公司,常规意义的“自由职业者”,但相较于“自由开源布道师”,适兕更愿意称自己为“独立开源布道师”——“自由”之后,其实需要一种更自律的状态,<strong>逃离了传统公司的打卡、绩效考核,完全是由自己来决定所有的工作、学习和要做的事情。</strong></p><p>如今,适兕依旧保持着每天 8 个小时以上的工作时间,包括读书、写作以及参与一些开源的事情,基本上是以远程线上工作为主。在没有疫情时,也会全国出差,参与各种会议、Meetup。</p><p>从全职受雇,到独立布道,这对适兕的改变不仅仅停留在职业上,还有生活上的变化 —— 不好的生活习惯的改善,开始运动,跑步和练习空手道,让生活更加规律,可以有更多时间陪伴家人,偶尔接送小孩上下学,情绪和内心的波动也可以得到平衡……</p><p>如果问“做全职独立布道师 6 年是一种怎样的体验?”那就是,工作和生活上都进入了一种能够自主决策的状态。</p><p><strong>「开源之书」,「开源之商」,「Community Leadership Development」等微信群群主</strong></p><p>2019 年时,因微信的封闭性而并不崇尚微信交流的适兕开始适应大众习惯,在微信上组建「开源之书」,「开源之商」,「Community Leadership Development」等微信群。</p><p>聊起这背后的初衷,适兕谈到:我非常热衷于交流,推崇对话精神。我在做演讲、给学生上课的时候,都非常渴望古希腊亚里士多德或者柏拉图倡导的对话形式,其实老师给学生授课、或者布道本身,它就是一种对话 —— 我们交流,不明白、不理解、不认同的地方再展开、深入沟通。这种对话其实要比单向输出好得多,让我受益匪浅,因为对方的视角会给我完全不同的思考,遭遇到挑战,然后相互学习沟通,这样才能让最真实的东西会被讨论出来,真理越辩越明。</p><p><strong>不泛泛而谈,喜欢就某一个问题展开深度讨论,热衷交流、崇尚对话精神</strong>—— 观察适兕组建的微信群,这些群聊的气质、组织方式、运行规则正遵循了这几点原则。三个群定位不同,但都有所聚焦 ——</p><p>「开源之书」的微信群成立于 2019 年,适兕向我们介绍到:最初是因为我自己读了很多开源相关的书,我希望和更多人交流。后来因为书都比较经典,也吸引到更多人参与,他们带着问题过来,比如他的问题可能是参与开源的人的动机是什么?或者是那些已经成功的开源项目到底做对了哪些事情?他会去读一些书去查一些资料,这个时候这中间遇到什么问题,我们就可以去讨论,我们还会组织线下的读书会活动。截止目前,<strong>我们已经共读了大概 40 本和开源强相关的书,比如说软件工程、组织、商业等等,涉猎很广,我们可以把它们统称为广义的“开源学”。</strong></p><p><img src="/img/bVcViuQ" alt="image.png" title="image.png"></p><p>而我在其中要做的事情就是把规则建立好,比如说我觉得最有特色的一个规则,就是无论你是谁,只要你半年内不在群聊中活跃就会被移除。看似会让提出去的人颇为尴尬,但反而会得到真正读书的书友们的认可和尊重。</p><p>「Community Leadership Development」 和「开源之商」也类似,它们专注在不同的领域和方向,聚焦社区领导力构建、开源商业等方面,有其中各自的规则。</p><h2>本土开源热?真实的开源世界依旧冷清</h2><p>谈到开源,回避不开的便是这两年来中国本土的开源热潮,然而在热潮中活跃着的适兕却对“本土开源热”持有着不同的观点。</p><p>在他看来目前国内的开源热还仅仅停留在关注的人多了,媒体、投资者、商业公司、科研院所谈开源谈得多了,Google 热点趋势提升了……但从开发者的角度来看,在开源商业公司里,在 Linux、GNOME、Apache 等开源基金会里,在代码托管平台上,在技术共同体里,这些开源真正发生的地方还很冷清。真正的热闹,是来自不同地区的开发者在不间断地 24 小时热烈地讨论着我下一个问题要解决什么,我现在遇到什么问题……而国内环境与其相比还有距离。</p><p><strong>我们期待着看到我们的工程师走进 community 里的具体项目中去解决实际的问题,到 SegmentFault 思否这样的社区平台讨论技术,到开源项目里去提交代码。</strong></p>专访信通院云大所郭雪:在事业单位做开源是种怎样的体验?https://segmentfault.com/a/11900000407862142021-10-09T16:59:32+08:002021-10-09T16:59:32+08:00茕茕码字https://segmentfault.com/u/qiongwrite0<p><img src="/img/bVcVivH" alt="image.png" title="image.png"></p><p><strong>访谈者</strong><strong>:朱娅迪,SegmentFault 思否内容运营负责人</strong><br><strong>受访者</strong><strong>:郭雪,信通院云大所云计算部副主任</strong></p><hr><p>提到“信通院”,一种神秘感油然而生。事业单位?科研院所?在这次和郭雪详谈前,我也一知半解。在事业单位做开源是种怎样的体验?信通院在开源产业中的定位如何?“十四五”将开源推向万众瞩目的焦点,开源是“一夜走红”吗?</p><p>作为本次 OSCAR 2021 开源产业大会主办方代表,<strong>信通院云大所云计算部副主任郭雪</strong>在会前接受我们的采访,为我们揭开了这层神秘面纱。</p><h2>我在事业单位做开源,国家使命感驱动</h2><blockquote>我所有工作,不管是做标准还是做政策支撑,都是希望这个行业、产业越来越好,“国家使命感”会影响到我。<br>—— 郭雪</blockquote><p>“中国信息通信研究院(以下简称‘中国信通院’)始建于1957年,是工业和信息化部直属科研事业单位”信通院官网的介绍中如是写到。事业单位在你印象里是一种怎样的存在?朝九晚五、喝茶看报?</p><p>郭雪的回答,和我们的猜想大相径庭“<strong>我们把自己定义为事业单位里的互联网公司,工作节奏很快,团队很年轻。</strong>我所有的工作,不管是做标准还是做政策支撑,都是希望这个行业、产业越来越好,'国家使命感'会影响到我。”说出这句话时,郭雪信念感十足。</p><p>作为中立平台,<strong>信通院以第三方的视角来构建生态</strong>。工作内容上,郭雪的日常工作主要集中在几个方面 —— 产业研究,围绕开源以及新技术方向,研究产业发展趋势,形成行业报告;政府智库,为政府政策文件提供支撑;标准制定,针对需要共识的领域进行标准化;测试评估,依据标准进行符合性测试;行业平台,推动行业内合作互通。</p><p><strong>用通用、标准化的方式,推动行业发展</strong>—— 围绕繁荣生态展开,信通院通过标准制定帮助产业链条上的企业快速发展。以开源为例,信通院制定了开源软件治理成熟度标准,通过把开源软件使用管理抽象成一套通用的方法论,帮助企业在内部用这套标准去管理开源软件使用,规避风险。同时,在 2021 OSCAR 开源产业大会上,信通院还计划发布《开源生态白皮书》给出全球及我国开源生态的全貌以及发展趋势 —— 这便是郭雪日常的工作产出。</p><p>工作在“国家队”,郭雪同时也活跃在各大民间社区和活动中 —— 开源之书共读小组、开源社中国开源年会……拥抱社区的她觉得交流很重要,“我工作中很重要的一部分就是聊天”,<strong>通过真诚地沟通了解企业痛点、解决实际问题。</strong></p><p><img src="/img/bVcVivL" alt="image.png" title="image.png"></p><p><strong>严肃认真,又保有热情</strong>,说到自己的工作状态,郭雪谈到“对人要真诚热情,对工作要严谨认真,工作中出现的错误我还是会严肃指出,认真对待它。”</p><h2>给企业的建议:切忌盲目开源</h2><h3>开源不是“一夜走红”,一步步见证了本土开源的繁荣</h3><p>2021 年 3 月“十四五”规划纲要全文发布 ,开源被首次列入其中,郭雪曾在云大所的视频号“云大说”中为大家解读开源趋势。</p><p>郭雪为我们介绍到,从政策层面,其实<strong>早在 2016 年时,国家发改委就曾在“十三五”国家信息化规划的通知中提到“推动龙头企业和科研机构成立开源技术研发团队”</strong>。2020 年国家发改委和中央网信办共同发布的《关于推动“上云用数赋智”行动培育新经济发展实施方案》中,也提到了对开源社区的支持。可以看到,国家层面一直都是鼓励开源创新和发展的。</p><p>2014 年起,郭雪从研究云计算的开源技术到研究整个开源产业,由于工作的原因,她见证了产业的变迁和兴盛。郭雪明显感受到,2014、2015、2016 年做开源时,大家明显更专注于开源技术本身,很少有人聊技术之外的话题,是一个非常小众的领域。而<strong>近两年起,广义的开源学开始兴盛</strong>,经常会有人聊起生态方法论、开源经济学、开源运营、治理、开源社区等等。</p><p>但开源并不是一个新兴业务,也并非“一夜走红”,早在上世纪 90 年代,就有很多人开始研究开源,<strong>他们是“第一代开源人”,而我们是第三代。</strong></p><p>(参考阅读:FOSS history in retrospec: 3 generation open source coders and users)</p><h3>企业做开源,谨记 3 个点</h3><p>本土的开源热潮,和政策的一片大好,也让郭雪有了新的担心 —— 很多企业并没有完全想清楚开源和其公司业务的关联就盲目开源,十分不可取。</p><p>在郭雪看来,一家企业做开源不可能完全从兴趣爱好出发,无论是自己构建开源生态,还是参与到开源社区中,都要有自己的闭环逻辑。因此<strong>第一点,企业在做开源前要想清楚自己在产业链条上的定位</strong>(供应侧/使用侧),<strong>做开源的动机和目标</strong>(如:供应侧企业希望获得商机转化,使用侧企业为了满足业务场景)。郭雪特别提到“做开源,图钱并不可耻”,重要的是想清楚图钱的逻辑、通道、链条,明确了投入产出,不忘初心,就不会在开源发展中迷失了方向。</p><p><strong>第二,做开源需要企业中自上而下的力量</strong>。自下而上做开源很难与公司战略和商业策略形成统一,也会有一定阻力。</p><p><strong>第三点与郭雪所在信通院的工作息息相关 —— 开源虽好,也有一定风险</strong>,从知识产权到安全……企业应该特别关注,并有方法地进行治理,规避风险。在这次 2021 OSCAR 开源产业大会上也特别设置了“开源风险管理”论坛。</p><h2>更开放的 OSCAR,917(就要一起)做开源</h2><p>2021 OSCAR 开源产业大会,至今已经是第五届,郭雪自认今年的会议筹备“花了不少心思”,她剧透了三个亮点供广大开源爱好者期待 ——</p><p>过去几年的 OSCAR 更多聚焦于开源技术和云计算开源,<strong>而今年已经不仅仅局限于技术研究,而是首次放眼到整个开源产业</strong>,开源方法论、产业生态、治理、文化等,通过大会分论坛设置也可窥得一二 —— 开源治理、开源社区治理与运营、开源风险管理、云原生开源、开源文化 & 开源之商,内容非常丰富。</p><p>同时,OSCAR 大会也是将信通院开源各项研究、标准的集中输出,<strong>这一年中与开源相关的各种白皮书、最新标准都将在大会上进行发布。</strong></p><p>今年的大会还有一大亮点,就是<strong>联合了更多合作伙伴 —— SegmentFault 思否、开源之道、开源社、openchain 等等</strong>,我们尝试“用开源的方式”办会,更丰富的合作伙伴也将为大会带来更开放的气质和更新颖多元的内容。</p><p>由于疫情的原因,本次大会线下规模大不,报名后需要额外审核参会资格。然而即便如此,郭雪依旧对接下来半个月的疫情发展忧心忡忡,然而社区里一位朋友对她的安慰却让她万分感动 —— 那位朋友(ID:Zhi Qiang)对她讲“只要你做开源,我们就是共同体,你做了这么多,我们一定撑 OSCAR,努力把这次活动办好”。据说 ALC Beijing 也计划组团前来,这又一次让郭雪感受到了社区的力量,靠开源的方式、大家每人添一把火,火焰一定熊熊燃烧,因此在她看来,这已经不完全是院里的工作、她个人的项目,<strong>而是所有开源人的一次线下聚会</strong>。</p><p>917,谐音:就要一起,选在这样一天举办 OSCAR,郭雪称是受 SegmentFault 思否 CEO 高阳对这一日期的有趣解读“就要一起做开源”——<strong>可信开源,共建共赢,我们等你来</strong>!</p><hr><blockquote><strong>采访手记:做自己的开源英雄</strong><br>采访前,我和内容组的其他同事努力在搜索引擎上检索着和郭雪有关的讯息,为这次访谈做准备,然而大多都是官方的新闻报道和演讲实录,我们不由得猜测,这样一位“事业单位的副主任”该是一个怎样的人,不免还有些紧张。 <br><img src="/img/bVcVivY" alt="image.png" title="image.png"><br>然而采访开始后,我悬着的心终于放下了,正如郭雪在采访中所说,她与人的沟通非常真诚,丝毫没有架子。她笑着向我们介绍她学生时期的爱好,喜欢做手工、自己做头饰,喜欢跳拉丁舞、工作后也曾坚持过一段时间,和我们每个人一样下班会煲煲剧,在快工作后享受片刻的慢生活……谈到家国情怀、谈到朋友对她的安慰让她几近流泪,我们感受到了她赤诚的热爱,不是一个“官方的发言人”而是一个活生生、血肉丰满的小姐姐。<br>引用<br>在<a href="https://link.segmentfault.com/?enc=2pSncI4T7bifxb3kBuB%2BoQ%3D%3D.lyQrBc3QwppTMKFIuwvVXpDM70t%2BNhkk8KnCjOhl6d84He70fpqeEbd%2FseWjH1ECNwqGESSed5ZoVnKXyQab0i814PfRZLRLlVPL4dgRPLCZpyGXKVYpi1cwrvIeE3wzE8q%2BZ0SFHiouIT1mztRyQ3X5NJSstWNMMgijCa1i54p5x9XwY4LsGt6PI7cxOJ0gw%2BJb0RYsLS2OtmoXVMDhfTSUpTcY1ok6dNTlmB%2FLHyiWV7qZB55%2BvVCXe6zn%2F7VY7fC3g8H7XWtOX5BUFl%2B7F0cCXPVfJKH6P1zlHUpNcsqHSL%2BXBGBkIAOyZwQFQNpr" rel="nofollow">上一篇 OSCAR 系列专访中我们采访了开源之道主创李建盛老师</a>,不仅介绍了他的开源之路,还谈了很多与初心有关的问题,这往往是媒体采访中常常会忽略的。在我们看来,这才是人物访谈真正的价值所在,不仅关注他的成就更回归人本身,挖掘丰满的人物形象,展现他/她不曾经常用以示人的一面。 <br>引用<br>开源英雄也是普通人,我们每个人都可以成为自己的开源英雄。</blockquote>Zilliz 合伙人栾小凡:The Apache Way对于我而言,就是利他主义https://segmentfault.com/a/11900000404980382021-08-11T14:18:50+08:002021-08-11T14:18:50+08:00思否编辑部https://segmentfault.com/u/writers0<blockquote><p><strong>The Apache Way对于我而言,就是利他主义</strong></p><p><strong>———栾小凡</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会已于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对 Zilliz 合伙人栾小凡的访谈。</p><p><img src="/img/bVcT5ws" alt="" title=""></p><p>以下为 SegmentFault 思否对栾小凡的访谈内容:</p><h3><strong>关于栾小凡</strong></h3><p>栾小凡,Zilliz 合伙人、工程总监,LF AI & Data基金会技术咨询委员成员。他先后任职于 Oracle 美国总部、软件定义存储创业公司 Hedvig 、阿里云数据库团队,曾负责阿里云开源 HBase 和自研 NoSQL 数据库 Lindorm 的研发工作。栾小凡拥有康奈尔大学计算机工程硕士学位。</p><hr><h3><strong>栾小凡初次接触开源的故事</strong></h3><p>2015年加入了一家软件定义存储Hedvig, 公司创始人是Apache Cassandra的作者Avinash Lakishman. 公司使用到了很早期cassandra的代码,当时发现了gossiper模块有一个bug会导致信息同步速度很慢,就修复了反馈给了cassandra社区。之后在阿里,也从事了相当长时间的HBase开发工作,一直在关注Apache Hbase,HDFS几个社区的发展。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>对于个人而言是增长了技术审美,结交了志同道合朋友。对于Zilliz而言,开源是我们快速迭代产品的重要途径,我们也希望通过我们的技术帮助到更多的用户解决非结构化数据的挑战,拓展自己的技术影响力。</p><hr><h3><strong>栾小凡理解的“The Apache Way”?</strong></h3><p>The apache way对于我而言,就是利他主义,召唤有这种精神的企业和个人帮助他人,这种帮助除了提供可以使用的产品,也包括了通过代码review等方式帮助他人成长。我们一直遵循Community over code的原则, 通过社区的协同合作让产品变得更好。</p><hr><h3><strong>栾小凡与 ApacheCon Asia</strong></h3><p>这次我所在的 Track 是 A Vector Database for Unstructured Data Processing,内容包括:什么Vector Database、能帮助我们解决什么问题、Milvus 2.0的设计实践和设计原理,以及常见场景。希望大家能在听完我的分享后能了解向量数据库是什么以及它能够解决的问题,以及了解云原生的数据库背后的设计原理准则。</p><hr><p><strong>关于 Milvus / Zilliz</strong></p><p>Milvus 是全球领先的开源向量数据库系统。MIlvus于2019年10月开源,并于2020 年 3 月正式通过技术委员会投票,成功加入 LF AI & Data(Linux AI 基金会)成为孵化项目。Milvus 项目蓬勃发展,被广泛应用于图片检索、视频内容分析、互联网搜索、推荐系统、虚拟助手、智能客服、网络安全、虚拟化合物筛选和基因序列分析等多个领域,在全球拥有超过1000家企业用户。2021年6月,Milvus通过技术委员会评审和投票,成为 LF AI & Data 基金会旗下毕业项目。</p><p>Zilliz是一家开源基础软件公司,专注于研发非结构化数据库系统,为各种AI应用提供数据基础设施。2020年11月,Zilliz完成4300万美元 B 轮融资,开创了全球开源基础软件领域最大单笔 B 轮融资的记录。</p><p>Zilliz公司的招聘邮箱:<a href="mailto:ta@zilliz.com">ta@zilliz.com</a>,长期招聘C++/Go开发人员、数据库开发工程师、AI算法工程师、数据工程师、高性能计算工程师、开发者关系经理等职位。</p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=aSHdtNPqbnV2lLTOerGvLw%3D%3D.naTJkq9a1c%2F4E1lCWFPQ14xMhWDeuJDcyFk0%2F4Hv8aefksD9LDeoF3VsP1%2Bnyo0uTW1dUhWZkBprpx7X3C2feQ%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>会议回放请点击【<a href="https://ke.segmentfault.com/course/1650000040452378">此处</a>】</p><p><img src="/img/bVcTt10" alt="" title=""></p>Zilliz 合伙人顾钧:开源在很大程度上改变了传统的软件生态https://segmentfault.com/a/11900000404931512021-08-10T16:32:08+08:002021-08-10T16:32:08+08:00思否编辑部https://segmentfault.com/u/writers1<blockquote><p><strong>我认为开源在很大程度上改变了传统的软件生态,为平衡生态中各种不同参与者的利益带来了可能性。</strong></p><p><strong>———顾钧</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会已于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对 Zilliz 合伙人顾钧的访谈。</p><p><img src="/img/bVcT4fG" alt="" title=""></p><p>以下为 SegmentFault 思否对顾钧的访谈内容:</p><h3><strong>关于顾钧</strong></h3><p>顾钧,Zilliz 合伙人、开源布道师,LF AI & Data 基金会技术咨询委员会成员。从业 17 年以来,他专注于数据库和大数据技术,先后任职于工商银行、IBM、摩根士丹利、华为等企业。顾钧拥有北京大学计算机系学士学位。</p><hr><h3><strong>顾钧初次接触开源的故事</strong></h3><p>2008年Oracle收购Sun,而开源数据库MySQL在前一年被Sun收购。我作为数据库工程师当时开始关注MySQL这个开源项目被Oracle收购以后可能出现的变化。MySQL数据库当时已经相对比较成熟,很多互联网企业开始把MySQL用于生产环境。我当时一直是一名服务于金融行业的Db2数据库工程师,对于MySQL所呈现出的成立感到很惊奇,从那个时候我开始逐步投入到对开源数据库软件的研究。</p><p>后来逐渐对开源社区,开源软件的商业化产生了强烈的兴趣。我认为开源在很大程度上改变了传统的软件生态,为平衡生态中各种不同参与者的利益带来了可能性。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>Milvus开源社区是我亲手构建的第一个开源社区。在这个过程中,不论是我个人还是我所在的创业公司Zilliz都得到了很大的成长。</p><p>首先,我们从一个封闭的开发环境转入了更加开放的模式。大家能够直接面对社区的参与者,聆听他们的反馈和建议。这帮我们避免了很多错误的尝试。</p><p>其次,通过持续的开源运作,我们也逐渐成为了AI开源生态中的重要一环。很多外部的软硬件公司主动联系我们寻求合作,这在封闭开发模式下是难以想象的。</p><hr><h3><strong>顾钧理解的“The Apache Way”?</strong></h3><p>我粗浅地归纳为,共建、共享与共治。</p><hr><h3><strong>顾钧与 ApacheCon Asia</strong></h3><p>我这次所在的 Track 是 Community,演讲的主题是 How We Build a Global Community of 1K Users in Two Years。今年10月,Milvus社区将迎来2周岁的生日,在不到两年的社区构建过程中,我们吸引了近千家企业成为Milvus开源项目的用户。我们分享了我们从中所取得的经验与教训。</p><p>希望我的分享能为各位观众想要投入开源的贡献者带来一些启发,更好地构建社区,与社区进行互动。</p><hr><p><strong>关于 Milvus / Zilliz</strong></p><p>Milvus 是全球领先的开源向量数据库系统。MIlvus于2019年10月开源,并于2020 年 3 月正式通过技术委员会投票,成功加入 LF AI & Data(Linux AI 基金会)成为孵化项目。Milvus 项目蓬勃发展,被广泛应用于图片检索、视频内容分析、互联网搜索、推荐系统、虚拟助手、智能客服、网络安全、虚拟化合物筛选和基因序列分析等多个领域,在全球拥有超过1000家企业用户。2021年6月,Milvus通过技术委员会评审和投票,成为 LF AI & Data 基金会旗下毕业项目。</p><p>Zilliz是一家开源基础软件公司,专注于研发非结构化数据库系统,为各种AI应用提供数据基础设施。2020年11月,Zilliz完成4300万美元 B 轮融资,开创了全球开源基础软件领域最大单笔 B 轮融资的记录。</p><p>Zilliz公司的招聘邮箱:<a href="mailto:ta@zilliz.com">ta@zilliz.com</a>,长期招聘C++/Go开发人员、数据库开发工程师、AI算法工程师、数据工程师、高性能计算工程师、开发者关系经理等职位。</p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=pRQLQ24%2FrRyYB%2Bm6oPpPNw%3D%3D.qCFOZfPi6fdC%2FT5L%2Fy9HtxBD%2BwUJLq6PSm9TzABJEy0paL6tBHLxAczkWHAahB0hkL%2FLFjRvKonS%2FS7jp5a8kQ%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>中国移动云能力中心 Iaas 产品部软件开发工程师陈焱山:社区始于连接,也成就于连接https://segmentfault.com/a/11900000404481662021-08-03T15:14:41+08:002021-08-03T15:14:41+08:00思否编辑部https://segmentfault.com/u/writers0<blockquote><p><strong>社区始于连接,也成就于连接</strong></p><p><strong>———陈焱山</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对中国移动云能力中心 Iaas 产品部软件开发工程师陈焱山的访谈。</p><p><img src="/img/bVcTQLA" alt="" title=""></p><p>以下为 SegmentFault 思否对陈焱山的访谈内容:</p><h3><strong>关于陈焱山</strong></h3><p>陈焱山,当前就职于中国移动云能力中心IaaS产品部。一直从事分布式存储软件架构设计及开发工作,深度参与了移动云的建设发展过程。在分布式存储领域拥有丰富的开发实战经验,目前移动云已经为全网用户提供EB级规模存储。个人当前主要关注于对象存储交付编排及流量治理建设,正在思考基于 Apache APISIX 七层网关实现对象存储流量治理工作,实现架构进一步升级。</p><hr><h3><strong>陈焱山初次接触开源的故事</strong></h3><p>说来也巧合,自己跟Apache也是有缘,第一次接触开源也是Apache下的项目Hadoop和HBase项目,当时也是采用HBase作为我们对象存储产品的元数据存储引擎。</p><p>当时我们的对象存储EOS还处在第一代自研中,其中就采用了基于NoSQL数据库HBase来实现元数据的列式KV存储,在计算服务方面则采用MapReduce。期间我主要负责元数据存储引擎的开发及优化工作。与此同时,我们还维护着一个300多节点的线上集群。随着用户业务量的增加,系统也出现了一些问题,其中对我来说印象最为深刻的就是频繁写删场景下HBase元数据逐渐成为系统访问瓶颈的问题。由于Hbase默认采用字典序,因而当向同一个对象存储桶中频繁写入或删除时对象时,后台承载的这个Region所在的HRegionServer节点就会出现读写访问热点问题,频繁执行Major Compact或者Region Split操作,然而这些后台动作不仅要消耗大量的主机资源,同时还会阻塞IO请求,直接影响到用户服务。最明显的感受就是平均时延飙升,甚至出现请求响应超时。为了解决这个性能瓶颈,我们通过对元数据Key的Hash化改造和HRegion数量的预规划分配,最终解决了HRegionServer的热点问题,系统读写性能提升了80%。虽然说后来随着时间的推移,我们产品技术栈进行了切换,但是研究HDFS和HBase这段经验,至今都让我受益,同时也让我对开源文化有了一个新的认识。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>开源其实就是对共享理念的一种继承和发展。对我个人而言,参与开源,参与Apache优秀的开源项目,不仅能够学习到优秀的代码,同时还能学习到一些优秀的架构设计思想。通过横向对比多个开源项目,你就会发现一些设计上的共性问题,能够在今后的系统架构设计时尽可能规避已知风险,优化架构设计。同时,我认为参与社区贡献还是一个自我能力展现的窗口,能够提升自己个人品牌和口碑,能够认识一些志同道合的人和业内大佬,进一步提升自己。</p><p>众人拾柴火焰高,对于公司来说,参与开源带来收获主要体现在两方面:一是能够利用社区人才的力量不断打磨好自己的产品,为公司带来实质性的收益;二是能够扩大公司在业界的影响力和品牌价值推广。我们的EOS对象存储同样也是基于开源,但同时我们也秉持着源于开源,回馈社区的理念,打磨好自身产品的同时,同步构建好生态周边。因为只有在开源社区不断投入,才能吸引到更多的开发者参与进来,形成正向增益,实现多赢的局面。</p><hr><h3><strong>陈焱山理解的“The Apache Way”?</strong></h3><p>我心目中的“Apache Way”是一个拥有开放包容、共享协作的社区文化,也就是Apache社区所倡导的Community Over Code社区大于代码文化。开放包容,我的理解是社区完全是Open的,既没有时间界限也没有地域界限,每个人都可以以平等自由的身份参与到社区项目中,都能为社区项目贡献自己的聪明才智和力量。在这里,你的提交可以是一个大的功能feature,同样也可以小的bug fix ,或者文档撰写,或者技术分享等等。总之,一切都是有益于社区文化发展的都是备受欢迎和推崇的。共享协作,社区始于连接,也成就于连接 。正是因为开源社区的存在,才使得一群志同道合的人能够愿意在一起共享协作,拥抱社区,一起去做一件有情怀,有意义的事情。</p><hr><h3><strong>陈焱山与 ApacheCon Asia</strong></h3><p>我本次分享主题是 Apache APISIX 在中国移动公有云对象存储 EOS 中的应用与实践,属于 API/微服务技术相关议题。首先从整体上介绍了中国移动公有云建设过程及对象存储产品发展演进历程,然后阐述了我们为什么选择 Apache APISIX作为我们的负载均衡网关,同时还分享了Apache APISIX在移动云EOS产品中的最佳实践和应用,期间谈到了如何利用Apache APISIX帮助我们解决实际生产问题,同时我们又基于此做了哪些实际工作,最后对我们未来的架构演进做了一些规划说明。</p><p>我希望听众听完我的分享之后,首先是大家能对中国移动有一个更全面的认识,认识到中国移动在技术能力内化道路上所做的努力,认识了解“移动云”这个云服务品牌;同时,也希望大家能够进一步了解并加入到Apache APISIX这个优秀的开源网关项目中,如何用APISIX正确处理传统的南北向流量以及服务间的东西向流量场景。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>开放包容,共享协作,一起来参加ApacheCon Asia这场技术盛宴吧!</p><hr><p><strong>关于中国移动云能力中心</strong></p><p>中国移动云能力中心,对外也称“中移(苏州)软件技术有限公司”,是中国移动通信集团2014年注资成立的全资子公司,公司定位为云设施构建者、云服务提供者、云生态汇聚者,三年内推动中国移动云业务市场份额进入国内云服务商第一阵营。“移动云”品牌也充分发挥了云网一体、贴身服务、随心定制、安全可控优势,打造5G时代的“你身边的智慧云”,为行业数字化转型发展提供“强引擎”。</p><p>目前我们对象存储EOS团队一直在持续招人中,感兴趣的同学可以通过邮件联系我<a href="mailto:chenyanshan@cmss.chinamobile">chenyanshan@cmss.chinamobile</a>.com,期待你的加入。</p><p>另外,我们团队所在的IaaS产品部多个岗位也在持续招聘中,分布式存储/云原生/虚拟化/边缘计算/内核等多个方向均开放有研发及架构师等多个职位!欢迎有意者联系我。</p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=RLqY6GYiDLavzW%2BO2sdiYw%3D%3D.gEPIY3WdsYWiOX4lZDJ6W%2FRYK5JUjHnHjVQyxsfHi4aU9UAW6IpK1CizSOWsHpeg%2B3ybbLABYVq1J5PaZQTKGg%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=pg6pnyn9J45%2FQLOZO7mXgA%3D%3D.E8sgH9n57NCMZXX0QHLUaT8qY4A9fB2jqCC7inAnGVtN2w6Mj4Jpy%2FNYGBOCJE0E" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>Apache APISIX PMC 张超:好的社区可以使得项目更加优质https://segmentfault.com/a/11900000404430302021-08-02T17:51:03+08:002021-08-02T17:51:03+08:00思否编辑部https://segmentfault.com/u/writers1<blockquote><p><strong>重视社区建设,重视每一位贡献者和参与者,社区永远大于代码,好的社区可以使得项目更加优质。</strong></p><p><strong>———张超</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对 Apache APISIX PMC 张超的访谈。</p><p><img src="/img/bVcTRed" alt="" title=""></p><p>以下为 SegmentFault 思否对张超的访谈内容:</p><h3><strong>关于张超</strong></h3><p>大家好,我是张超,现在就职于深圳支流科技有限公司,主要负责公司的服务网格和 Cloud 产品;我是 Apache APISIX 的 PMC,也是开源爱好者,为 OpenResty 和 ingress-nginx 等项目做过贡献。</p><hr><h3><strong>张超初次接触开源的故事</strong></h3><p>我是在实习的时候就接触到了开源,我的主管是一名非常有技术追求的人,也是他带着我接触到了 OpenResty 社区以及这个社区里的人。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>对于我个人来说,做开源让我认识到了更多的人,提升了自己的技术眼界,也得到了更多和别人交流的机会。</p><p>对于公司来说,因为我们是基于 Apache APISIX 做商业化的,这也让更多人了解我们公司,提升了公司的影响力。</p><hr><h3><strong>张超理解的“The Apache Way”?</strong></h3><p>重视社区建设,重视每一位贡献者和参与者,社区永远大于代码,好的社区可以使得项目更加优质。</p><hr><h3><strong>张超与 ApacheCon Asia</strong></h3><p>我所在的 Track 是 API & 微服务,演讲主题是如何将 Apache APISIX 扩展为服务网格的边车。Apache APISIX 是一个高性能,全动态的云原生 API 网关,然而它所能做到的却不仅仅局限于 API 网关领域本次分享将为大家介绍如何将 Apache APISIX 扩展为服务网格的数据面边车服务,以及 APISIX Mesh 带来的优势(如更好的性能,统一南北向和东西向的技术栈等),最后为大家介绍 APISIX Mesh 的未来发展计划。</p><p>希望观众在听完我的分享后能够更加了解 Apache APISIX 和它所能解决的问题,从而以后进行技术选型的时候能够多一种方案。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>本次 ApacheCon Asia 大会将为大家带来众多精彩的技术分享,涵盖各个领域,总有一个适合你,快来报名参加吧!</p><hr><p><strong>关于支流科技</strong></p><p>支流科技是一家提供 API 处理和分析的开源基础软件公司,提供 API 网关、k8s ingress controller、Service Mesh 等微服务和实时流量处理的产品和解决方案。致力为全球企业管理并可视化 API 和微服务等关键业务流量,通过大数据和人工智能(AI)加速企业业务决策,驱动数字化转型。</p><p>由支流科技捐赠给 Apache 软件基金会的顶级项目 APISIX,是新一代的云原生 API 网关,提供负载均衡、动态上游、灰度发布、服务熔断、身份认证、可观测性等丰富的流量管理功能。</p><p>欢迎大家关注 Apache APISIX <a href="https://link.segmentfault.com/?enc=Na3l8999fo0Yzmxzy9bHKA%3D%3D.tHZmZ%2B1rFCEJ4U9eMCTCNoXMP0IGapX4gJaxvJh%2BzPA%3D" rel="nofollow">http://apisix.apache.org</a>;如果的对支流科技感兴趣,也欢迎联系我们:<a href="mailto:support@api7.ai">support@api7.ai</a></p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=RQshddj1E0xUKbBljDMmeg%3D%3D.p9hQfy0kcYbQT%2FJ3sX0bhbV%2B08JTvo%2BgtnWVYZYY4kObWRMBX1gipb7PEGBTbKllcZylrhzxSFtEcx5xoyVcng%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=Uh4uUWZbryqFbURyp7a47g%3D%3D.dQTimyW6nN4Sv6kUsi0GFuhjhZbAPa6HQpAY%2FUTy0MZGsM7Xtda6rXw%2F49Gd3xYb" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>Apache Member、ALC Beijing 发起人姜宁:一个人走的很快,但是一群人能走得更远https://segmentfault.com/a/11900000404237822021-07-29T15:39:48+08:002021-07-29T15:39:48+08:00思否编辑部https://segmentfault.com/u/writers0<blockquote><p><strong>一个人走的很快,但是一群人能走得更远</strong></p><p><strong>———姜宁</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对Apache Member、ALC Beijing 发起人姜宁的访谈。</p><p><img src="/img/bVcTMd8" alt="" title=""></p><p>以下为 SegmentFault 思否对姜宁的访谈内容:</p><h3><strong>关于姜宁</strong></h3><p>Apache 软件基金会 Member、Apache Local Community (ALC) Beijing 发起人 —— 姜宁。</p><p>姜宁 华为开源软件中心技术专家,前红帽软件首席软件工程师,有十五年以上企业级开源中间件开发经验,有丰富的 Java 开发和使用经验,函数式编程爱好者。</p><p>从 2006 年开始一直从事 Apache软件基金会 (ASF) 开源中间件项目的开发工做,前后参与 Apache CXF, Apache Camel,Apache ServiceMix,以及 Apache ServiceComb 的开发。2015 年开始担任 ASF 孵化器导师,先后参与孵化了 Apache Rocket,Apache Weex (retired),Apache Skywalking,Apache ShardingSphere, Apache IoTDB,Apache Doris(Incubating),Apache APISIX,Apache Shenyu (Incubating),Apache Kyuubi(Incubating) 。</p><hr><h3><strong>姜宁初次接触开源的故事</strong></h3><p>初次接触开源还是在读研的时候,当时因为需要使用一些开源项目来完成课题相关的开发工作,当时对我来说最大的感受就是开源项目的文档和代码都是活生生的学习教材。 </p><p>真正开始全职加入到开源项目是在2006年的时候,当时IONA亚太研发中心成立了一个6个人的开发小组,专门从事一个叫做 Celtix 的 WebService Java 开发框架的开发, 后来这个项目和 Xfire 合并成为 CXF 进入 Apache 软件基金会孵化,我作为项目初始的成员成为 Apache 软件基金会的 Committer。当时在国内能够专职做开源的机会并不多,我非常有幸成为其中一员,具体的心路历程大家可以参考我之前的写的一篇<a href="https://link.segmentfault.com/?enc=RYGiRX3idRAwLw4jPrk7lw%3D%3D.IvudTeWD0rDkkZACGhiu5DzwX%2FeBHZ%2FZESyiyuE%2F4O7sWJ8ROkgo%2FLL24ZJeL0Z6kmMcEfAKtiWWRRcX%2BFG7Csgx%2Bbuwsc%2BOVyHt1Gj7nUZgWaYRodwaT%2BreyCkwk0Rd" rel="nofollow">博客</a>。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>参与开源我觉得最大的收获就是见识到了世界级的优秀软件是如何开发出来的。 借助开源社区的帮助,我们可以十分高效地将开源项目打造完善,借助开源社区我们可以做到一个人都不敢想象的事情。参与 Apache 软件基金会给最大是收获就是成为孵化器导师,在帮助国内项目孵化的过程中不但加深了对 Apache Way 的理解,积累了很多项目孵化的经验,同时收获到了一群好朋友,这为后续成立 ALC Beijing 奠定十分重要的基础。</p><hr><h3><strong>姜宁理解的“The Apache Way”?</strong></h3><p>我理解的 The Apache Way 的核心价值 开放透明,精英之治 Meritocracy,社群化的协作。</p><p>在 Apache 有一句话,就是事情只有在邮件列表上发生了才算是真正发生了。 通过这种开放透明可存档方式,极大降低了大家获取信息的成本,让我们可以跨越时空进行沟通交流。 </p><p>Meritocracy 将权力交给实际干活的人,让有才能的人展现出来,让好的点子脱颖而出,真正做到才配其位。这种按照以对社群贡献的功绩来衡量才能,并且赋予权力的运作方式,保证了志愿者社群的健康发展。这种运作方式极大鼓励大家要站在社群的角度上看待问题,跨越组织边界,帮助团队成员成长, 而不是局限在自己蝇头小利上。</p><p>社群化协作让大家跨越各种边界为了共同的目标聚到一起协同解决同样的问题。只有依托社群化的协作,我们才能完成一个人不可能完成的事情。 开源的开放协作文化可以让来自于不同公司,有着不同背景的人坐在一起一同解决大家关心的问题。除了我们可以在一起开发软件,我们也可以在一起制定标准,或者是一起写一本书,创作一个故事。一个人走的很快,但是一群人能走得更远。通过开放协作我们可以做到很多时候一个人想都不敢想的事情。</p><hr><h3><strong>姜宁与 ApacheCon Asia</strong></h3><p>我第一次参加 ApacheCon 是在 2007 年,当时 Aapche 北美峰会是在亚特兰大举办的,会议是在中心的酒店举办,距离亚特兰大奥运会公园并不远, 因为 2008 年北京奥运会的原因,我对举办过 1996 年奥运会的亚特兰大有很大的兴趣,特地去了离会场不远的亚特兰大奥运会公园逛了一下, 而且当时我在心中就许下了一个小愿望,就是想什么时候 ApacheCon 能在北京举行。 </p><p>随着越来越多的源于国内的开源项目加入到Apache软件基金会,越来越多的国人参与到 Apache 项目建设中来, 成为 Apache 项目的 Committer,PMC 成员。 我们在 Apache 软件基金会的声音也越来越大。</p><p>非常高兴这次今年 ALC Beijing 能够承办 Apache Con Asia 2021 大会, 虽然由于疫情的关系我们和 200 多位国内外讲师只能通过线上会议的方式相聚,但借助会务平台我们在三天的大会中可以做很多近距离的交流。</p><p>我所在的 Track 是 Keynote,演讲主题是孕育开源社区,· 开源共同体(Open Source Community) 借助互联网能够把用户和开发者有机的凝聚在一起,让大家跨越组织边界,为了一个共同的目标有效地协作起来。 为了让大家拥抱开放透明,合作共赢的开源文化,孕育健康发展的开源生态,我们在积极融入到业界成功的开源共同体过程中吸取经验的同时,还要在组织内部孕育有机发展的开源共同体。</p><p>希望大家能在听完我的分享后能够了解开源共同体的组成要素,以及开源共同体与知识社群之间的关系,为了培育有机可持续发展的开源共同体,我们需要坚持的哪些原则。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>ApacheCon Asia 将在 8 月 6 日到 8 日在线上举行,本次大会的主题是 Let's grow the community together! 这次大会将为大家带来 Apache 软件基金会最新的项目动态,以及开源文化,开源社区建设相关的经验分享。 欢迎大家注册并参会!</p><hr><p><strong>关于 ALC Beijing</strong></p><p>ALC Beijing 是服务于本土的 Apache 软件基金会(ASF)项目的社群, 我们通过举办活动,将本地的 ASF 项目开发者与用户联系在一起;通过分享开源开发经验,鼓励更多的人参与到 ASF 的项目开发中来;为 ASF 的项目寻找相互合作的机会,让这些项目能够更加茁壮的成长;介绍 ASF 管理和运作开源项目的成功之道,帮助大家更好地运作开源项目。</p><p>今年 ALC Beijing 非常高兴承办了 ApacheCon Asia 2021的会议, 欢迎关注这次会议,与我们的讲师,Track Chair 和志愿者进行互动。</p><p>公众号:ALC Beijing</p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=s9od49g08HzZ018UOsHdAg%3D%3D.yJpXCZYOo1fRb%2FXdK2koKo%2BCAKBZkFf2G5ov%2FR8Jt1DDhl%2Fde4c56YPLLOeompQs2dPs4CQtGo3OqDzGE9CNNQ%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=FiZt0%2FNuyYXPlvuvq0gyOQ%3D%3D.hVcJGH8LhqPfSiEYcJHuVWA3F%2F%2Bm7WPil6E7vHxj1hzVIu8X77dAG6L3bUF2g%2FuI" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>腾讯云高级工程师程力理解的“The Apache Way”:Open, collaboration and Win-win.https://segmentfault.com/a/11900000404182702021-07-28T16:34:04+08:002021-07-28T16:34:04+08:00思否编辑部https://segmentfault.com/u/writers0<blockquote><p><strong>Open, collaboration and Win-win.</strong></p><p><strong>———程力</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对腾讯云高级工程师程力的访谈。</p><p><img src="/img/bVcTKFV" alt="" title=""></p><p>以下为 SegmentFault 思否对程力的访谈内容:</p><h3><strong>关于程力</strong></h3><p>我是Apache Ozone社区PMC,Hadoop社区Committer,目前在腾讯云对象存储团队工作。曾经在AWS S3,华为存储等团队工作过。</p><hr><h3><strong>程力初次接触开源的故事</strong></h3><p>第一次大规模的投入开源是2019年,hadoop孵化对象存储项目Ozone,作为一个开源新人,投入Ozone项目中,跟随项目一起成长,主导设计交付了MultiRaft,SCM HA等重大特性后,在社区中担任了更重要的角色,同时也伴随了Ozone成为了Apache顶级项目。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>首先从参加Apache开源社区开始,我个人本身的代码规范,代码质量,到与社区成员合作沟通,共同协作的能力都有了明显的增长。更理解了开源社区,合作开放共赢的意义,同时伴随着Ozone项目成为Apache顶级项目和腾讯公司的在Hadoop和Ozone项目上的持续投入,在公司内外部的大数据项目中,也交付了一些内外部的客户使用场景,利用Ozone这个存储项目,帮助腾讯公司在私有化高密度存储设备的使用上找到了解决方案,实现了外部客户的实际价值。</p><hr><h3><strong>程力理解的“The Apache Way”?</strong></h3><p>Open, collaboration and Win-win.</p><hr><h3><strong>程力与 ApacheCon Asia</strong></h3><p>这次我有两个talk:</p><p><strong>Big Data</strong></p><p><strong>腾讯云基于Hadoop-COS搭建的三层透明加速,助力数据湖</strong></p><p>腾讯云对象存储COS在2019年提交Hadoop-COS文件系统插件到Hadoop社区后,融入了云原生存储的场景中,承载了大数据、AI、容器等应用EB级别的数据量。</p><p>今年腾讯云COS对于Hadoop-COS做了全面升级,增加了数据湖三层加速的功能特性,加速数据湖的构建和发展,同时助力大数据和AI的架构融合。本次演讲主要分享:</p><ol><li>云原生生态下的Hadoop-COS存算分离</li><li>Hadoop-COS三层透明加速</li><li>大数据和AI下的数据湖架构</li></ol><p>此次演讲中,讲师主要分享腾讯云基于对象存储COS推出的湖仓三层加速方案,能达到最高10倍的读写加速提速,并且基于Hadoop-COS做到了Schema透明加速。</p><p>同时分享者也将介绍腾讯云如何基于Hadoop-COS三层透明加速,融入大数据+AI的统一数据湖架构。</p><p>期待听众对于腾讯云的数据湖加速方案有所了解,理解数据湖在大数据和AI场景下目前的具体使用案例。</p><p><strong>Big Data</strong></p><p><strong>Apache Ozone如何利用Raft协议完成高可用方案和吞吐性能大幅提升</strong></p><p>Apache Ozone在2020年正式成为Apache顶级项目,Ozone支持对象、HCFS,fuse等多种访问方式,腾讯工程师在Ozone社区中表现突出。</p><p>腾讯云团队在Ozone社区领导开发多个重要特性,此次演讲将重点分享其中两大特性,MultiRaft和Ozone High Availability,这两个Ozone社区的关键特性都是基于Raft协议完成的。</p><p>本次演讲主要分享:</p><ol><li>如何利用Java Reflection和Raft协议完成Ozone元数据的强一致同步,完成Ozone高可用性建设</li><li>如何利用Multi-Raft特性,提升Ozone DataNode的单节吞吐能力</li><li>如何Multi-Raft特性,适配高密度硬盘机型,将Ozone融入私有化数据湖方案</li></ol><p>观众可以从演讲中获取腾讯团队巧妙运用Raft和Java reflection解决Ozone一致性难题,同时也能从Multi-Raft实现和配合高密度磁盘机型的案例中获取优化DataNode写性能的新思路。</p><p>期待用户深入了解Ozone项目如何通过Raft实现元数据高可用和数据节点性能优化。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>一起来参与Apache社区的盛宴,见证开源的进化。</p><hr><p><strong>关于腾讯云</strong></p><p>腾讯云存储团队目前在大力发展数据湖生态,欢迎有志之士加入。有意向的可以联系<a href="mailto:timmycheng@tencent.com">timmycheng@tencent.com</a></p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=qHxjOFUiWvLvHBeDOIfbSw%3D%3D.rlN75Hr0Ntgg2BEyWzW3jKhqLYfuTkhMMqPiGd91LOKQZuF1aLhvrUB7u4qYmhyiQyhBDAWPzigctlR5wY%2BZNQ%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=tL6L3HO8YsRMS6YxMHXijw%3D%3D.0oB%2FIcNVskrSXxviPtQ%2BsAT2MoreIaJS7LohntjotmzeeXcdgxbKCeF0ahp5FHBr" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>Kyligence 联合创始人兼 CEO 韩卿:Apache kylin 只是一个开始https://segmentfault.com/a/11900000404102852021-07-27T15:21:51+08:002021-07-27T15:21:51+08:00思否编辑部https://segmentfault.com/u/writers1<blockquote><p><strong>The Apache Way 有两点:一是Comunity over code;二是Open the dicussion and open the decison</strong></p><p><strong>———韩卿</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对 Kyligence 联合创始人兼 CEO 韩卿( Luke Han)的访谈。</p><p><img src="/img/bVcTIyR" alt="" title=""></p><p>以下为 SegmentFault 思否对韩卿的访谈内容:</p><h3><strong>关于韩卿</strong></h3><p>大家好,我是 Kyligence 联合创始人兼 CEO 韩卿( Luke Han),同时也是 Apache Kylin 联合创建者及 PMC Member。非常荣幸和开心可以参加本届 ApacheCon Asia。</p><hr><h3><strong>韩卿初次接触开源的故事</strong></h3><p>这个确实要追溯到很早期了。我记得大概是刚毕业第一第二年就开始接触开源项目,真正深入做出有世界影响力的开源项目就是 Apache Kylin 。这个项目的成功离不开 eBay 公司的支持,最初的立项、团队、客户案例等都是从 eBay 内部挖掘的,我记得项目一开始就获得 eBay 高级副总裁的评价: Ready Open Source from Day One。</p><p>现在回想起当时,有个小插曲。由于东西方文化差异,刚加入 Apache 社区时,很多西方人并不看好我们,对我们的语言,交流以及文化等持怀疑态度,但慢慢地我们适应并学会了西方开源社区的规则并融会贯通,最终获得了整个 Apache 社区和基金会的认可。在这个过程中,我们确实克服了许多难题,也获得了宝贵的经验。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>收获非常多,这段经历对我以及日后的创业都产生了重要影响。首先,ApacheKylin 正式毕业成为 Apache 顶级项目,成为首个来自中国的 Apache 顶级项目,和 Hadoop,Spark 等处于一个级别。同时,我自己也是 Apache Kylin 联合创建者及 PMC Member。这些让我很有成就感。其次,最宝贵的地方在于这让我拓展了个人的全球化视野,我认识了很多不错的开源届的朋友,接触到了不同的机会。kyligence 就是由 Apache Kylin 创始团队共同创建的,公司已经服务了全球过千家企业,这表明市场和客户对于我们的认可度也越来越高。</p><hr><h3><strong>韩卿理解的“The Apache Way”?</strong></h3><p>我认为有两点。一是 Comunity over code,社区比代码要重要很多,在我看来打造社区文化更重要,例如帮助用户解答问题会使人非常有贡献感和成就感。只有代码不能叫做开源社区。第二是 Open the dicussion and open the decison,我们希望有一个环境可以供大家畅所欲言,打造一个更加开放的氛围让社区里的人都有收获。</p><hr><h3><strong>韩卿与 ApacheCon Asia</strong></h3><p>我这次演讲的主题是 From Open Source to Product,开源项目产品化的思考与实践。演讲内容包括开源产品化如何落地、kyligence 实践经验分享等等。</p><p>我相信现在肯定有很多人谈技术、谈开源本身,这些话题我们成立之初也都分享过。但是今天我想从另外一个角度给大家一些思考 。kyligence 已经成立五年多,这其中我们有了很多的新的感悟、经验,甚至是教训。所以我想和大家从产品的角度聊一聊如何运营一个开源项目,如何让开源项目找到价值定位,在市场中落地。我希望从我们的实践经验出发能够给到更多参与开源的爱好者们一些参考。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>Apache Kylin 是第一个由中国贡献到 ASF 的顶级开源项目,我们希望未来有更多的人加入,一起 make something different and more。</p><hr><p><strong>关于 Apache Kylin</strong></p><p>我记得刚加入 Apache 社区时,华人特别少,很多西方人并不看好我们,对我们的语言,交流以及文化等持怀疑态度,也不看好我们最后的顺利毕业,因为之前也有几个来自中国的项目,最终都失败了。但 11 个月之后,我们顺利毕业成为了 Apache 顶级项目,获得了社区高度认可。</p><p>一路走来,我真的非常高兴今天看到更多的华人活跃在社区,kyligence 也是由 Apache Kylin 创始团队共同创建,致力于为全球各行业客户提供智能化的数据服务和管理。</p><p>不久前我们宣布了 D 轮融资,公司正处于快速发展阶段,目前也开放了多个招聘岗位,欢迎更多志同道合的同学加入。大家可以投递简历至 HR 邮箱:<a href="mailto:talent@kyligence.io">talent@kyligence.io</a>,我们的 Slogon 是不积跬步,无以“智”千里,未来期望与大家一同奋斗与努力,创造更多不一样的可能。</p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=XpSiM6dHaXZRsHjdV9ixJw%3D%3D.tAy4utV6AHSsSUtyE%2BKgcLGAl8j4D2DAvZiI91UARrsK%2BdBdNGuWwYt2eaDU6ivN0PpzYLhn%2Fyh%2F9m5FqDIUow%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=Ntrw10fH8t1wQMaEBHyqVw%3D%3D.%2BPOul3LZI%2Fhhy8WI2EBoZDcGaQdQiulM3Q35%2FSz38ULgDunojc92LS0S6KsclGja" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>StreamNative 联合创始人翟佳:开源和 Apache 社区是个带有魔法的宝库https://segmentfault.com/a/11900000403929442021-07-23T14:02:19+08:002021-07-23T14:02:19+08:00思否编辑部https://segmentfault.com/u/writers0<blockquote><p><strong>实际上对于 Apache Way 究竟如何定义没有教科书的严格规定,每个参与 Apache 社区贡献的人都有自己的理解和诠释,一千个人有一千个哈姆雷特。</strong></p><p><strong>———翟佳</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对 StreamNative 联合创始人翟佳的访谈。</p><p><img src="/img/bVcTEb2" alt="" title=""></p><p>以下为 SegmentFault 思否对翟佳的访谈内容:</p><h3><strong>关于翟佳</strong></h3><p>大家好,我是翟佳,感谢 SegmentFault 安排的本次采访。我目前是 Apache 软件基金会顶级项目 Apache Pulsar 和 BookKeeper 的 PMC 成员和 Committer,长期活跃在开源社区,目前专注在国内布道 Apache Pulsar,让大家更好地了解 Pulsar 这个云原生时代的消息流系统的优势与特性。</p><p>同时,我还是 StreamNative 的联合创始人,这是一家成立于 2019 年初的开源基础软件公司,公司由 Apache Pulsar 创始团队成员组成,支持 Apache Pulsar 社区建设和发展,同时提供 Apache Pulsar 的商业化服务,帮助客户更好地使用 Apache Pulsar,在 Message Queue 和 Streaming 等场景中提供最专业的解决方案。</p><p>在 ApacheCon Asia 2021 中,我负责消息系统(Messaging) Track 推进事宜,这里也感谢来自北美、印度和国内各位讲师对消息系统 Track 的支持与配合。</p><hr><h3><strong>翟佳初次接触开源的故事</strong></h3><p>在大学时候就对开源有些了解,但还没有特别深入参与某个开源项目。当我从中科院计算所研究生毕业加入 EMC 从事文件系统和分布式设计与开发,期间在公司项目中有幸接触和使用到 Apache BookKeeper──基于 WriteAheadLog 的低延迟、高性能、强一致性的分布式存储引擎,就开始持续参与和贡献 Apache 开源项目了。后来,逐渐成为 Apache Pulsar 和 BookKeeper 的项目管理委员会成员(PMC Member)。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>开源和 Apache 社区是个带有魔法的宝库,让我结识了更多认同开源和技术的小伙伴,大家的日常交流都能带来很大启发,很多人从网友 ID 变成了同事、合作伙伴。在自己成立 StreamNative 创业以来,我们选择开源商业化这条路,就是坚信开源也能带来商业上的成功。目前 StreamNative 的团队管理也借鉴了开源社区,坚持自我驱动、异步沟通、远程办公、没有办公室,非常扁平化的工程师文化。</p><hr><h3><strong>翟佳理解的“The Apache Way”?</strong></h3><p>Apache Way 也就是我们常说的「Apache 之道」,实际上对于 Apache Way 究竟如何定义没有教科书的严格规定,每个参与 Apache 社区贡献的人都有自己的理解和诠释,一千个人有一千个哈姆雷特。</p><p>但在 Apache 社区长期的协作和治理过程中,大家抽象出了几大原则目前是被普遍接受和取得共识的,如赢得权威、同侪社区、公开沟通、共识决策、项目自治、独立自主、社区胜于代码。</p><p>其中,「社区胜于代码」应该是被大家引用最广泛、也是被我牢记最深的一条,也就是一个健康的社区比高质量的代码具有更高优先级,拥有强大的社区可以修复纠正代码层面的问题,这是构建持续活跃社区的原因所在。我们要真正相信社区所具备的能量,相信它,与它始终在一起。</p><p>Apache Way 不仅仅适合 Apache 软件基金会旗下开源项目,也能为其他厂商自主开源和其他开源软件基金会项目所参照。在开源社区中的沟通,都可以互为参照。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>ApacheCon Asia 是 ApacheCon 首次亚洲峰会,让我们共同构建这个“第一次”!</p><hr><p><strong>关于 StreamNative</strong></p><p>StreamNative 是一家开源基础软件公司,由 Apache 软件基金会顶级项目 Apache Pulsar 创始团队组建而成,围绕 Pulsar 打造下一代云原生批流融合数据平台。StreamNative 作为 Apache Pulsar 商业化公司,专注于开源生态和社区构建,致力于前沿技术领域的创新,创始团队成员曾就职于 Yahoo、Twitter、EMC、Splunk等知名大公司。如果你热爱开源文化,想要全职来做开源的工作,那就快加入我们吧!</p><p>简历发送邮箱:<a href="mailto:cn_recruiting@streamnative.io">cn_recruiting@streamnative.io</a> 。</p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=UKGXN0RyjWFZwca9DpnOvA%3D%3D.EtijSmSyHg5Id0dM7a5QZJSn35iIa4Yj8fM8FutMDpElIwH%2BkADzSjYxE0%2FTWuqtwqHzNSOd1q8IHXsUKNb7ig%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=YEhWaiqcmcS9%2FvpNA6b7CQ%3D%3D.XCQyWbXAi35ejx%2BSqSd2okqcjhHljzRLu27CwDU5k0tufatIMD70ZwPZALIaYu%2F5" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p> Apache ShardingSphere Committer 孟浩然:我的开源之旅还在继续https://segmentfault.com/a/11900000403876462021-07-22T15:06:47+08:002021-07-22T15:06:47+08:00思否编辑部https://segmentfault.com/u/writers1<blockquote><p><strong>简单概括一下我所理解的“ The Apache Way”就是社区、开放、热爱和持续。</strong></p><p><strong>———孟浩然</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对 Apache ShardingSphere Committer 孟浩然的访谈。</p><p><img src="/img/bVcTCOz" alt="" title=""></p><p>以下为 SegmentFault 思否对孟浩然的访谈内容:</p><h3><strong>关于孟浩然</strong></h3><p>大家好,我是孟浩然,SphereEx 高级 java 工程师,Apache ShardingSphere Committer。曾就职京东科技,负责数据库产品研发,热爱开源,关注数据库生态,目前负责 Apache ShardingSphere 分布式数据库中间件的研发以及开源社区建设。</p><hr><h3><strong>孟浩然初次接触开源的故事</strong></h3><p>相信和大部分的Java 程序员一样,在刚开始参加工作的时候,我其实就已经在接触和使用一些Apache 的开源项目了。但是那个时候对开源并没有概念,也不知道开源的意义。</p><p>说起我的开源之旅,首先还是想感谢ShardingSphere 的创始人张亮先生,很荣幸能够在2020年1月加入京东科技由张亮带领的数据库研发团队,开始参与ShardingSphere的研发工作。</p><p>ShardingSphere是一个很庞大的项目,有100多个模块,想一开始就直接提交代码做贡献是很难的。在社区的引导下,我开始从一些新手任务,比如修改文档、提高单元测试覆盖率、代码优化等入手,一边了解项目,一边熟悉社区内的沟通方式。</p><p>随着对整个项目的熟悉,之后我开始从比较擅长的分布式治理模块入手深入了解源码,思考优化方向,参与模块功能重构,直到后来主导某些具体功能的开发。</p><p>在这个过程中,我在社区的代码贡献量,以及在社区的参与度都在稳步提升,直到2020年7月3号,我通过了ShardingSphere社区的邮件投票,正式成为了Apache ShardingSphere社区Committer,开始以全新的身份为社区贡献力量。</p><p>今年5月我也顺利加入 SphereEx,专注于以 ShardingSphere为基础,打造开源分布式数据库生态。当然,我的开源之旅还在继续。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>对个人而言,自身技术能力的提升是最直接的收获,Apache 开源项目代表了世界上最前沿的技术水平,同时无论对架构还是代码,甚至是文档都有着很高的要求。所以在参与开源的过程中,必须以最高的要求为标准,一遍一遍的重构自己提交的代码以及文档,而这也恰恰是在打磨自身的技术能力;</p><p>其次在参与Apache 社区过程中,还认识了很多各个领域同样热爱开源的技术大拿,他们热爱技术,乐于分享,每一次在社区和他们交流都收获颇多。</p><p>对公司而言,参与开源项目,就意味着能够第一时间了解相关技术发展动态,同时能够提升公司产品能力,而且还能从社区中找到更专业的技术人才,节省招聘成本,总之好处多多,希望未来能有更多的公司和个人加入开源,共建开源生态。</p><hr><h3><strong>孟浩然理解的“The Apache Way”?</strong></h3><p>因为我是在ShardingSphere社区的帮助下,一步一步成长起来的,所以ShardingSphere社区所践行“ The Apache Way”的方式其实就是我所理解的“ The Apache Way”。 一直以来,ShardingSphere以开放的心态,积极引导帮助热爱技术,热爱开源的同学加入社区,并且始终坚持以社区驱动为主,持续推动项目健康发展。简单概括一下我所理解的“ The Apache Way”就是社区、开放、热爱和持续。</p><hr><h3><strong>孟浩然与 ApacheCon Asia</strong></h3><p>我所在的 Track 是中间件,演讲的主题是《Apache ShardingSphere分布式数据库中间件生态下的数据库治理之道》。数据库治理作为Apache ShardingSphere核心功能之一,为分布式环境下的数据一致性和服务高可用性提供了解决方案;本次分享将为大家带来Apache ShardingSphere在分布式数据库治理方面的最佳实践,同时将从服务治理、数据治理等多方面详细介绍其架构和实现原理以及未来功能的规划。</p><p>希望大家在听完我的分享后对最新版本ShardingSphere整体架构和设计思想有初步的认识,对 ShardingSphere 的数据分片、读写分离等核心功能也会有整体的了解, 通过深入分析ShardingSphere在服务治理、数据治理等方面的架构和实现原理,了解如何在分布式环境下使用ShardingSphere提供数据服务。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>ApacheCon首次亚洲大会,140+会议组成的技术盛宴,热爱技术,喜欢开源的朋友一定不能错过,欢迎报名参加!</p><hr><p><strong>关于Apache ShardingSphere</strong></p><p>Apache ShardingSphere 是一套开源的分布式数据库解决方案组成的生态圈,它由 JDBC、Proxy 和 Sidecar(规划中)这 3 款既能够独立部署,又支持混合部署配合使用的产品组成。 它们均提供标准化的数据水平扩展、分布式事务和分布式治理等功能,可适用于如 Java 同构、异构语言、云原生等各种多样化的应用场景。</p><p>作为 ShardingSphere 背后的商业公司,SphereEx一直秉承开源、共享、生态、平台理念,致力于数据领域前沿技术创新,构建新型分布式数据基础设施。率先提出的"Database Plus"、"Database Mesh"理念,旨在开创新的数据使用理念、提升企业数据应用水平、轻松地应对复杂数据应用场景。</p><p>目前SphereEx正在招聘优秀人才,欢迎追求技术、热爱开源的朋友通过<a href="mailto:hr@sphere-ex.com">hr@sphere-ex.com</a> 投递简历加入SphereEx,开启全职开源之旅。</p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=j90at3Rro0YHV%2FmZrIX1Zw%3D%3D.JsJuqnUC2QnKv%2FPIc9Q8s3HUFZC8LFJkvcmX6onwvGI3LEbJmSb7n9NYSWGvGSj15SjX3CZB%2FtzWPxABZHUV%2BA%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=AHcvODui6J8wY707cl6cKw%3D%3D.wHxVu387HwBeooj3vwgB7MR45DZVN7dUV5t1OIy8kF6lMHyTqT%2FwskTx0VIzzS7a" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>Apache brpc committer 李磊:通过分享,后人才能够不断踩在巨人的肩膀上前行https://segmentfault.com/a/11900000403798452021-07-21T11:12:11+08:002021-07-21T11:12:11+08:00思否编辑部https://segmentfault.com/u/writers0<blockquote><p><strong>在社区这个海量的宝库中,我们首先享受到了开源项目的成果,极大地提升了开发效率,使我们不必再走弯路、不必再重复造轮子,能够更快地前进。</strong></p><p><strong>———李磊</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对 Apache brpc committer 李磊的访谈。</p><p><img src="/img/bVcTALE" alt="" title=""></p><p>以下为 SegmentFault 思否对李磊的访谈内容:</p><h3><strong>关于李磊</strong></h3><p>大家好,我是李磊,毕业于西安交通大学,目前在字节跳动任职基础架构工程师,从事图数据库、分布式KV的研发工作,是Apache brpc(Incubating) 的committer。</p><hr><h3><strong>李磊初次接触开源的故事</strong></h3><p>初次接触开源是刚工作的时候,那时使用Apache Hadoop中的MapReduce实现离线作业。当时为了优化作业运行时间,我将一个MapReduce作业优化为了MapOnly的任务,但也是此时遇到了一些问题。当一台机器上的Mapper任务已经执行完成后,不幸该机器宕机了,之前已经完成的Mapper任务会被重新执行。而对于MapOnly的任务,其实是不需要再重新执行的,因此这里有很大的优化空间。在一位Hadoop contributor同事的指导下,我完成了对这个问题的修复,并贡献到了社区。</p><p>随后的项目中,为了优化rpc开销,我在项目中引入了Apache brpc(Incubating),并不断学习、参与社区的工作,贡献了一些feature,也修复过一些bug,更深度地参与到了开源社区,并收获良多。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>通过参与开源,在社区这个海量的宝库中,我们首先享受到了开源项目的成果,极大地提升了开发效率,使我们不必再走弯路、不必再重复造轮子,能够更快地前进。当然在享受成果的同时,我们也积极回馈社区,为社区贡献微薄之力。在这期间,我认识了很多优秀的前辈,在实践中学到了更深入的技术,帮助到了社区的很多用户,也使自己更快地成长了。</p><hr><h3><strong>李磊理解的“The Apache Way”?</strong></h3><p>我理解的“ The Apache Way”其核心是分享。众多优秀的项目被分享到Apache社区,又在社区大量开发者的共同努力下日益成熟。每位开发者都分享自己的创新,使得项目在社区中生根发芽、茁壮成长。人类的进步一直都是这样,通过分享,使得后人能够不断踩在巨人的肩膀上前行,而这个思想在Apache社区体现地淋漓尽致。社区沉淀了开发者数不尽的智慧,也向世界上每位开发者敞开了欢迎的大门,大家都可以在已有的积累上继续创新和分享,驱动软件技术飞速发展。</p><hr><h3><strong>李磊与 ApacheCon Asia</strong></h3><p>我所在的 Track 是 Incubator,演讲主题是“字节跳动分布式图数据库基于BRPC的实践”。ByteGraph是字节跳动自研的一款分布式图数据库,其支持存储万亿边数据规模的超大图,单集群支持千万级读写QPS,总运行规模近万台服务器。在这样大规模的场景下,ByteGraph依赖了brpc提供高性能、易用、稳定的rpc框架支持。本次分享将分别介绍ByteGraph和brpc,以及ByteGraph这样的大规模分布式系统基于brpc的实践经验。</p><p>brpc是一款优秀的C++ RPC框架,已经在很多公司很多场景都有应用,当然,也还有一些朋友可能还不了解它。本次分享希望与大家交流brpc的设计思想,brpc的使用经验,以及如何解决可能遇到的一些问题。期望这些经验能够给大家一些参考,对大家的工作有所帮助。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>这里有业界前沿的技术、优秀的思想,快来!</p><hr><p><strong>关于Apache brpc(Incubating) </strong></p><p>Apache brpc(Incubating) 是一款优秀的工业级C++ RPC框架,其兼容多种协议并易于拓展,具有极其优异的性能、出众的稳定性、以及丰富的周边工具。截止目前,已有包括百度、爱奇艺、字节跳动、哔哩哔哩等多家公司,在大量项目中使用了brpc。非常期待在大家的共同努力下,brpc能够帮助到更多的项目,也欢迎大家参与到brpc的社区工作中,一同构建世界级的RPC框架。感兴趣的同学可以邮箱联系<a href="mailto:lorinlee@apache.org">lorinlee@apache.org</a>,或微信联系lorinll。<br>另外,也欢迎大家加入字节跳动基础架构,这里有业届领先的分布式存储/计算技术,超大规模的应用场景,感兴趣的同学也可以微信或邮箱联系我。</p><hr><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=vjkqsRvJrXPIyMFDAcQxKw%3D%3D.87V2P9o1a6VvGDT%2B455dQAA9qbjBK9um91yP%2Brj75bOxyOCHZOrTuomQx5E1krEiGf8vT0B2%2BJIbKSVcgh4q8g%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=lPNEDNMGjwyGzHyeaXTpgA%3D%3D.Ji2xsJgo08vwTEsZ7lpIXrdlUqfSuZ2WQiRes1EGq7wG0SdhcXbXrcxAHt5rzPkD" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>Apache DolphinScheduler PMC 郭强:开源最大程度地满足了我的某种虚荣心https://segmentfault.com/a/11900000403759712021-07-20T16:28:33+08:002021-07-20T16:28:33+08:00思否编辑部https://segmentfault.com/u/writers0<blockquote><p><strong>降低贡献者的参与门槛,一直是我们所努力的目标。</strong></p><p><strong>———郭强</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对 Apache DolphinScheduler PMC 郭强的访谈。</p><p><img src="/img/bVcTzFO" alt="" title=""></p><p>以下为 SegmentFault 思否对郭强的访谈内容:</p><h3><strong>关于郭强</strong></h3><p>大家好,我是Apache DolphinScheduler社区的PMC-郭强。</p><hr><h3><strong>郭强初次接触开源的故事</strong></h3><p>在我毕业后的第一家公司,二维火。当时组内有个师兄在做开源相关的事情,他是Dubbo的PMC,以及Netty榜单上为数不多中国贡献者,当时觉得如果自己写的代码能够影响很多的人,很多的公司,那么也算作为个体,在这个世界上留下来一点有价值的东西,于是就去参与开源社区的贡献。最早开始做的事情都比较简单,参与的项目也比较多。后来一次偶然的机会接触到DolphinScheduler,感觉社区挺不错的,也比较活跃,于是就开始深入参与DolphinScheduler。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p><strong>个人技术深度广度的提升</strong>: 一般活跃贡献者都是这个领域的资深专家,参与开源的话可以有很多和他们一起交流的机会,透过他们,我可以弥补很多我的一个知识盲区。DolphinScheduler其实是一个同其他领域结合比较紧密的,比如资源管理、注册中心、文件存储、监控系统等等,对于我来讲,涉及到的面足够广但同时作为一款基础设施软件它又要求足够专业,但在社区中,有各个领域的专家,比如我们4月份发布的1.3.6版本,SkyWalking的一位Committer@haili0为我们实现了DolphinScheduler的链路监控(SkyWalking),我有机会了解SkyWalking的插件如何设计如何实现,这对我来讲,是一个很不错的体验以及学习机会。</p><p><strong>拥有很多聊得来的朋友</strong>:能混在一个开源社区的都是一帮志同道合的人,大家都是因为喜欢某一种技术,喜欢开源的方式以及对极客文化的崇拜,因此大家能够很好的聚在一起而达成某一件事,同时,因为志同道合,所以大家很容易就成为了朋友,对我来讲,开源给我带来了很多朋友,他们分布在不同的公司,不同的地域,除了技术之外,我们也会聊一些关于生活、兴趣爱好、美食特色等等。甚至我在Dolphin社区遇到我之前公司的同事郭继伟,我们并不认识,只是通过开源认识。后来一问,你哪个公司的呀,我当时也在这个公司啊。也是真的很巧,万万没想到曾经错过的人会以这种方式认识。他也是一个非常厉害并且很热心的人,也是多个项目的PMC。换个说法,参与开源其实也是一种独特的且高效的社交方式。</p><p><strong>个人优势最大程度的发挥</strong>:吴晟老师之前的一个采访——开源领域中需要40+的开发者,也需要更张扬的年轻人,有提到:我们在日常的项目运营中,看到很多年轻工程师有精力、有一腔热血,但做事情很容易走错方向,因为行业经验太少了,是按照以往的经验来干活,不知道前面可能有一些什么样的坑在等着。 但假如有这种 40 岁以上的开发者能帮他们指出问题,就可以少走弯路。哪怕他们的代码量不多,但代码质量相对来说一定会是很好的,并且更能沉得住气来解决问题,更能接受长线的运营项目,就像中国的第 N 个五年计划一样。我觉得这是对高年龄程序员的一个定位。</p><p>SkyWalking 有一个 90 后的贡献者,他就是那种知道自己经验不足但会坚持表达的人,这样才可能做出一些之前想不到的事情。比如他把 SkyWalking 集成到了 IDE 中,在源代码中就可以看到指标,这个思路就很特别。 这就是年轻人的独特价值,是 40 岁的开发者提供不了的。但 40 岁的开发者可以保障你的奇思妙想得到很好的、快速的实现,避免走偏路,那么对于我来讲,其实也一样,我的一个想法可以在社区中实现(当然,前提是有用的idea),我们社区的VP代立冬代老师有个特色:我不同意,但我支持你,看似矛盾,但其实这种支持导致我去不断的去深入去矫正我得设计,最终赢得大家的认同。很多大的设计其实一开始也是由一些不成熟的想法逐渐碰撞碰撞最终完善。哪有一开始的高楼呢?</p><p><strong>这从来都不是一个怀才不遇的年代,只是看你怎么选择</strong>。透过开源,你可以最大程度的展示出你自己。</p><p>因为开源是一个你可以真正拿代码说话的一个地方,你可以同不同语言不同国家的人在同一个项目中去协作、沟通,从而成就你自己。另外一点,开源社区对所有的人都一视同仁,无论你来自什么地区什么公司什么学历等等,这种机制让所有人可以真正表现出自己。而你对开源的贡献是完全公开的,任何人都可以看到你的贡献,你有多优秀,一目了然。</p><p><strong>被认同感</strong>:马斯洛理论需求中谈到人的高级需求,譬如尊重需要,那么透过开源,我最大程度得到了这种满足。当然也许是满足我的虚荣心:)</p><p>无论作为什么角色,被认同感都是非常需要的。我最早参与开源目的其实很简单,就是希望这可以作为我的谈资,无论是面试或者和朋友聊天,我可以很自信的说出你们用的这个开源软件有我写的代码。就如同当时我倾慕我师兄那样,我也希望得到别人的倾慕。</p><p>试想一下,当你写的代码能够跑在数以万计的机器上,创造大量的价值,那种成就感就很爽。</p><p><strong>而开源最大程度的满足了我的这种虚荣心。</strong></p><p>我印象比较深的是之前收到过一封邮件,是一个印度贡献者的,我merge了他参与Apache DolphinScheduler的第一个PR,他写了大概几百字的一封邮件,表达对于开源的向往、对我的感谢以及询问我后续参与贡献的一个途径,这样的事情对我来讲几乎每天都会去做,在我看来不值一提,但是他的感谢让我很满足,帮助别人其实也是一件很快乐的事情,甚至我们所做的每一件事日后都有可能影响别人的人生轨迹,就像当初我师兄对我所做的一样。</p><hr><h3><strong>郭强理解的“The Apache Way”?</strong></h3><p><strong>Community Over Code:即社区大于代码</strong>:这个是我感触比较深的,像其实国内我接触到的代码写的很漂亮的开源项目很多,但是能够保持持续活跃的很少,很多项目仅仅是开源了代码,项目的早期也有用户,但是没有一个良好的社区文化来支持项目发展,因此在过了一段时间后,项目就停止维护了,而Apache社区倡导社区比代码更重要,因为有好的社区,代码会越变越好,即使一开始代码比较差,但是通过活跃社区的协同合作,差的代码会变好;反之如果没有好的社区,代码会逐渐腐化,最终死亡。同时,Apache基金会也认为,对社区的贡献,不仅仅局限于代码,bug report,文档,测试,撰写博客,参与线上线下活动等都是对该项目的贡献。像我们社区贡献者其实蛮多元化的,有代码贡献的,文档贡献的,会议分享的,活动组织的等等。也是因为这些贡献者,社区才能保持持续的生命力。</p><p><strong>MERITOCRACY:即任人唯贤</strong><br>无论是什么人,只要你在遵守Apache Way的前提下去贡献,当你的贡献得到社区的认可的时候,那么会赋予你Committer或者PMC这样的角色。也就是把权力交给真正干活的人。代老师喜欢把这个称之为赚功德,你对社区的一点一滴的贡献也是在积累大家对你的认可以及个人影响力。这里其实我想说补充一点,成为PMC或者Committer在某种层面并不是终点,这只是个头衔,追求头衔的贡献本身没有错,但如果成为PMC是你对于这个项目的贡献终点,那其实没有多大意义。你收获了什么其实自己很清楚,PMC是对你贡献的认可,但也只是针对你眼下的贡献而已,长期参与开源项目收获的远比这个头衔本身要大得多。持续关注意味着你要一直投入进去,可以了解到用户会怎么使用到你的产品,随着技术更新迭代你的产品是怎么做兼容的,可以增加你对某个领域的深度。</p><p>Apache 成功的背后离不开 Apache Way,这个是Jim(ASF任期最长的董事)聊到关于InnerSource与The Apache Way的一段话,大家感兴趣可以看看。</p><blockquote><p>With Jim Jagielski</p><p>At its core, InnerSource applies the “lessons learned” from successful, healthy Open Source projects to guide and direct enterprise IT development. Another way to look at InnerSource is applying the principles and tenets of Open Source development to internal processes and principles. With this in mind, it’s critical for those adopting InnerSource to understand the what and how, but even more importantly the why of those tenets, as well as which particular ones to emulate. We have found that the best model by far are tenets used by the Apache Software Foundation (ASF), collectively termed “The Apache Way.”</p><p>In a nutshell, The Apache Way can be condensed into what is the unofficial motto of the ASF: Community Before Code. This does not mean that the code (or the software project) is unimportant, but rather that secure, innovative, enterprise-quality, and healthy code depends on the health and vitality of the community around it. This realization emerged at the origin of the Apache Web Server project and the Apache Group.</p></blockquote><hr><h3><strong>郭强与 ApacheCon Asia</strong></h3><p>我所在的 TRACK 是 WORKFLOW/DATA GOVERNANCE,我的演讲主题是Apache DolphinScheduler - An Excellent Scheduler Tool for Massive Complicate Tasks,Apache DolphinScheduler是海量复杂任务稳定调度的场景需求下顺势而生的一款调度工具,本次议题将围绕其稳定性、易用性等多个方面来介绍DolphinScheduler。同时,我们也会带来2.0-微内核架构设计,2.0后,DolphinScheduler的各个组件将以SPI的形式开放出去,用户可以在这个基础上快速实现自己的特性需求。</p><p>我希望听众听完我的分享后能够加入到社区贡献者中来,因为当时做微内核架构也是有考虑到另外一个点,也就是我上文提到的,DolphinScheduler社区目前有很多其他社区的贡献者,比如SkyWalking、ShardingSphere、Dubbo等,调度系统更是与其他大数据生态紧密结合,我们希望通过微内核插件化的方式,使得各个领域的专家都可以以最低成本的贡献进来。降低贡献者的参与门槛,一直是我们所努力的目标。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>欢迎大家参与ApacheCon Asia!</p><hr><p><strong>关于Apache DolphinScheduler</strong></p><p>Apache DolphinScheduler是一款强大的带有有向无环图(DAG)可视化界面的分布式大数据工作流调度平台,DolphinScheduler解决了复杂的任务依赖关系和简化了数据任务编排的工作。它以开箱即用的、易于扩展的方式将众多大数据生态组件连接到可处理 100,000 级别的数据任务调度系统中来。目前项目贡献者300多人。他们来自中国、德国、印度、澳大利亚等其他地域,我们非常欢迎更多的同学能够加入到社区贡献者中来,一起打造一款优秀的开源项目。</p><hr><h4>关于 ApacheCon</h4><p>ApacheCon 是 Apache 软件基金会的官方全球会议系列。自 1998 年以来,ApacheCon 一直吸引着各个层次的参与者,在 350 多个 Apache 项目及其不同的社区中探索 "今天的明天技术"。在 2020 年和 2021 年,ApacheCon 活动通过会议、主题演讲、真实世界的案例研究、社区活动等,以虚拟的方式展示无处不在的 Apache 项目和新兴的创新,所有这些都是在线的,而且是免费的。欲了解更多信息,请访问 <a href="https://link.segmentfault.com/?enc=egr%2B1ysrVDevfC%2FjCTMuvg%3D%3D.wXX6ICob7GNcrWTtNYLOCQzZQeTZbvdECq8wdsQ4WnU%3D" rel="nofollow">http://apachecon.com/</a> 和 <a href="https://link.segmentfault.com/?enc=L9PPr1%2BL9yYHEAVxciRLwg%3D%3D.r8OoYOnmuZ1vmTh5yWtZIEbrbbPdhPqKnCQuRET8AS0%3D" rel="nofollow">https://twitter.com/ApacheCon</a> 。</p><h4>关于 Apache 软件基金会 (ASF)</h4><p>Apache Software Foundation 成立于 1999 年,是世界上最大的开源基金会,管理着 2.27 亿多行代码,并向公众提供价值超过 200 亿美元的软件,而且 100% 免费。ASF 的全志愿者社区从最初的 21 名创始人监督 Apache HTTP 服务器发展到 850 多名个人成员和 200 个项目管理委员会,他们通过 ASF 的 "The Apache Way "与 8200 多名提交人合作,成功领导了 350 多个 Apache 项目和计划。Apache 软件是几乎所有终端用户计算设备的组成部分,从笔记本电脑到平板电脑再到企业和关键任务应用的移动设备。Apache 项目为大部分互联网提供动力,管理百万亿字节的数据,执行兆位数的操作,并在几乎所有行业中存储数十亿的对象。商业上友好和宽松的 Apache 许可证 v2 是一个开放源码的行业标准,帮助启动了数十亿美元的公司,并使全世界无数的用户受益。ASF 是一个美国 501(c)(3) 非营利慈善组织,由个人捐款和企业赞助商资助,包括 Aetna、阿里巴巴云计算、亚马逊网络服务、Anonymous、百度、彭博、Budget Direct、Capital One、Cloudera、Comcast、Confluent、Didi Chuxing、Facebook、谷歌、Handshake、华为、IBM、微软、Namebase、菠萝基金、Red Hat、Reprise 软件、Target、腾讯、Union Investment、Verizon Media 和 Workday。欲了解更多信息,请访问 <a href="https://link.segmentfault.com/?enc=7mES1J3IOZpFwxDe6J%2Fn2A%3D%3D.xYAdAOwmo4mjl5CV57GmjvORN4ECPcCgNwgO%2Btl5g%2BQ%3D" rel="nofollow">http://apache.org/</a> 和 <a href="https://link.segmentfault.com/?enc=1aozvx9JmOv4Ue1gXTl1mw%3D%3D.dKmgC9wUMbmv7m%2BoKZ9xem%2BJOgbYkFXBcFOGBWqOn8Q%3D" rel="nofollow">https://twitter.com/TheASF</a> 。</p><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=UgEkmvtfl3YYQYu0DyNwIw%3D%3D.tKSAcf4qb4TCZs9gSxBkFSi5%2Fgo0amZzro8VJMeleFl5K9qTsT6f%2B7S3b9XsfwsUNeNQDflSggCbdRc9bNZT9g%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=%2Ffliwh4oQI8V981%2FYb97KQ%3D%3D.yXah3%2FQcM919lrLsCuase5uf%2Fpv2hfwc5tuJqCWJZgTvT6R9ST1cdk96eg1fXkFB" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>亚马逊云科技首席架构师费良宏:开源软件已经成为了云计算的重要基石https://segmentfault.com/a/11900000403680242021-07-19T14:53:51+08:002021-07-19T14:53:51+08:00思否编辑部https://segmentfault.com/u/writers2<blockquote><p><strong>我心目中的“Apache Way”包含有这样的内容:赢得信任、平等参与、开放协作</strong></p><p><strong>———费良宏</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对亚马逊云科技首席架构师费良宏的访谈。</p><p><img src="/img/bVcTxIp" alt="" title=""></p><p>以下为 SegmentFault 思否对费良宏的访谈内容:</p><h3><strong>关于费良宏</strong></h3><p>费良宏,亚马逊云科技首席架构师。在过去的20多年一直从事软件架构、程序开发以及技术推广等领域的工作。经常在各类技术会议上发表演讲进行分享,他还是多个技术社区的热心参与者。擅长的领域包括Web应用、移动应用以及机器学习等的开发,也从事过多个大型软件项目的设计、开发与项目管理。目前专注与云计算以及互联网等相关技术领域,致力于帮助中国的开发者构建基于云计算的新一代的互联网应用。</p><hr><h3><strong>费良宏初次接触开源的故事</strong></h3><p>我是在1994年第一次接触到了Linux 操作系统,记得当时使用的Linux 分发版本是Slackware。这应该是我最早使用到的开源软件。从那时起,<strong>在工作中尤其是软件开发中开源软件就成为了必不可少的一部分</strong>。例如我现在使用的Linux 操作系统、VIM/Emacs 编辑器、Python/Go/Rust程序语言以及MySQL、Spark等项目已经是我工作中最重要的工具。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>可以说开源软件已经成为了云计算的重要基石。作为开发人员开源软件的广泛使用帮助了云计算的快速成长与发展;同时,在云上应用开源软件的经验也在反哺开源软件的不断成熟。</p><hr><h3><strong>费良宏理解的“The Apache Way”?</strong></h3><p>我心目中的“Apache Way”包含有这样的内容:</p><ul><li>赢得信任: 每个人都有参与社区的机会。每个人的影响力来自于他们对社区的贡献。通过努力可以赢得社区的认可和信任。</li><li>平等参与:参与社区是个人,而不是人背后的组织。社区的扁平化结构决定了无论头衔如何,角色都是平等的。社区的行为准则要求互相尊重</li><li>开放协作: 社区是一个虚拟的组织,所有与代码和决策相关的沟通都可以公开访问,以确保相互协作</li></ul><hr><h3><strong>费良宏与 ApacheCon Asia</strong></h3><p>我的演讲主题是Apache Hudi on AWS,Apache Hudi是一个开源数据管理框架,用于简化增量数据处理和数据管道开发。我将介绍如何在云上部署与使用Apache Hudi,可以处理多读或多写的用例,并且Hudi将使用Apache Parquet和Apache Avro管理存储在S3上的底层数据等这一类的实践。</p><p>我希望听众听完我的分享后可以了解如何在云端使用Apache Hudi,例如处理来自传感器和其他物联网设备的流数据或者实施变更数据捕获(CDC)系统等场景。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>来吧,参加开发者的这一场盛宴ApacheCon Asia !</p><hr><p><strong>关于Amazon Web Servbice</strong></p><p>自成立以来,Amazon Web Servbice一直是开发人员在云中构建和运行开源软件的最佳场所。Amazon为支持开源项目、基金会和合作伙伴而自豪。Amazon相信开源对每个开发者都有好处,并将致力于将开源的价值带给开发者,并将Amazon的卓越运营带给开源社区。Amazon 的开源项目有这样一些:Babelfish for PostgreSQL、EKS Distro、Bottlerocket、AWS Distro for OpenTelemetry、Firecracker<br>以及OpenSearch 等等。</p><hr><h4>关于 ApacheCon</h4><p>ApacheCon 是 Apache 软件基金会的官方全球会议系列。自 1998 年以来,ApacheCon 一直吸引着各个层次的参与者,在 350 多个 Apache 项目及其不同的社区中探索 "今天的明天技术"。在 2020 年和 2021 年,ApacheCon 活动通过会议、主题演讲、真实世界的案例研究、社区活动等,以虚拟的方式展示无处不在的 Apache 项目和新兴的创新,所有这些都是在线的,而且是免费的。欲了解更多信息,请访问 <a href="https://link.segmentfault.com/?enc=ExV7aziMVfxFRGuyx%2ByQsw%3D%3D.mDSK8y1%2F951%2FYsXiEYTi2jdZSqZb4xqYB7K06mhbs%2F8%3D" rel="nofollow">http://apachecon.com/</a> 和 <a href="https://link.segmentfault.com/?enc=Sc764vjxwSm%2BhUE13ImvQg%3D%3D.zT0p4eYcZPITmY3pbxOAdZoanuRSMQPQDwHCoqOVbSg%3D" rel="nofollow">https://twitter.com/ApacheCon</a> 。</p><h4>关于 Apache 软件基金会 (ASF)</h4><p>Apache Software Foundation 成立于 1999 年,是世界上最大的开源基金会,管理着 2.27 亿多行代码,并向公众提供价值超过 200 亿美元的软件,而且 100% 免费。ASF 的全志愿者社区从最初的 21 名创始人监督 Apache HTTP 服务器发展到 850 多名个人成员和 200 个项目管理委员会,他们通过 ASF 的 "The Apache Way "与 8200 多名提交人合作,成功领导了 350 多个 Apache 项目和计划。Apache 软件是几乎所有终端用户计算设备的组成部分,从笔记本电脑到平板电脑再到企业和关键任务应用的移动设备。Apache 项目为大部分互联网提供动力,管理百万亿字节的数据,执行兆位数的操作,并在几乎所有行业中存储数十亿的对象。商业上友好和宽松的 Apache 许可证 v2 是一个开放源码的行业标准,帮助启动了数十亿美元的公司,并使全世界无数的用户受益。ASF 是一个美国 501(c)(3) 非营利慈善组织,由个人捐款和企业赞助商资助,包括 Aetna、阿里巴巴云计算、亚马逊网络服务、Anonymous、百度、彭博、Budget Direct、Capital One、Cloudera、Comcast、Confluent、Didi Chuxing、Facebook、谷歌、Handshake、华为、IBM、微软、Namebase、菠萝基金、Red Hat、Reprise 软件、Target、腾讯、Union Investment、Verizon Media 和 Workday。欲了解更多信息,请访问 <a href="https://link.segmentfault.com/?enc=NMMiB41YYus6zDTp4%2FlzTw%3D%3D.ZphOu4QxaJwc4y2ZSZVWLy4YACB7FpEC4h%2BshBKj2FI%3D" rel="nofollow">http://apache.org/</a> 和 <a href="https://link.segmentfault.com/?enc=P%2BrXCto%2F0ag1ipLunXVyWA%3D%3D.ja4UfcrR6E4QloYDRrGBu8AopAlNfsvlwCjz5daF1xc%3D" rel="nofollow">https://twitter.com/TheASF</a> 。</p><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=foOJ5eDuWYbzdgJ%2BHUf2Ug%3D%3D.BLPSPo8LCfRm5vU9MhRF51dNHmbrUbYY8zhLmdrjhjHVMIzI06H2Bf6WxH%2BB2O5smVP92clHd6p0FXkjbMuHfA%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=JqScXLiCUbJEUEJBYBDTFA%3D%3D.6tlaqjKGymkjJloJzItlyt3dxlXrG52jQbjqSWCJfYTDwbaNipTsS46QfnX6TjX2" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>Apache ShardingSphere ElasticJob 核心开发者吴伟杰:参与开源成为了我工作中的一部分https://segmentfault.com/a/11900000403598242021-07-16T19:50:47+08:002021-07-16T19:50:47+08:00思否编辑部https://segmentfault.com/u/writers1<blockquote><p><strong>我认为 The Apache Way 是一种生活和工作的方式。一群志同道合的人,按照大家都认可的方式去经营项目和社区,完成共同的目标。</strong></p><p><strong>———吴伟杰</strong></p></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对Apache ShardingSphere committer,Apache ShardingSphere ElasticJob 核心开发者吴伟杰的访谈。</p><p><img src="/img/bVcTvBm" alt="" title=""></p><p>以下为 SegmentFault 思否对吴伟杰的访谈内容:</p><h3><strong>关于吴伟杰</strong></h3><p>大家好,我是吴伟杰,Apache ShardingSphere committer,Apache ShardingSphere ElasticJob 核心开发者。目前为 SphereEx 中间件研发工程师,主要参与 Apache ShardingSphere 及 ElasticJob 的研发。</p><hr><h3><strong>吴伟杰初次接触开源的故事</strong></h3><p>去年 6 月,我在 GitHub 上第一次给 Apache 项目提 PR (Pull Request),那段时间恰逢 ElasticJob 项目重启,成为 Apache ShardingSphere 的子项目,社区里发布了很多新手任务,我觉得很有意思,就参与了其中。同时我也很感谢我的朋友皓之当时把我拉进了社区交流群,不然我还不一定能够开启我的“开源之旅”。</p><p>我的第一个 PR 是移除项目中的一些第三方依赖,并对脚本和页面做小调整。当时我的 PR 被合并,让我感受到了社区对我的认可,也让我感觉到了开源社区里还有很多有意思的事情可以参与,后来我就持续参与社区里的任务,参与开源项目就成了我当时的业余活动之一。<strong>而现在,参与开源成为了我工作中的一部分</strong>。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>对我个人而言,参与 Apache 顶级项目,学习优秀的代码,对专业能力的提升有很大的帮助。另一方面,在 Apache 项目中留下我的贡献,也是对我专业能力的一种认可。不过最重要的是,在参与的过程中,能够认识到很多志趣相投的人,他们对我的发展给予了不少帮助,能够加入 SphereEx 跟着大佬们一起进步,是我最大的收获之一。</p><p>对于公司,SphereEx 源于 Apache ShardingSphere,参与 Apache 社区贡献,也是在间接或直接地完善公司的产品,<strong>并能够保持不断的创新,加速更多优秀产品的诞生。</strong></p><hr><h3><strong>吴伟杰理解的“The Apache Way”?</strong></h3><p>我认为 The Apache Way 是一种生活和工作的方式。一群志同道合的人,按照大家都认可的方式去经营项目和社区,完成共同的目标。</p><hr><h3><strong>吴伟杰与 ApacheCon Asia</strong></h3><p>此次我是在中间件 Track。本次分享我将为大家介绍 Apache ShardingSphere 的子项目 ElasticJob,包括 ElasticJob 的功能特性、架构及原理,以及 3.0 相比历史版本的改进。</p><p>希望大家听完我的分享后对 ElasticJob 有基本的了解,在当遇到有动态分片、高可用等需求的任务调度场景时,能够想起 ElasticJob 提供的能力。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>不来白不来,来了不白来。</p><hr><p><strong>关于Apache ShardingSphere ElasticJob</strong></p><p>Apache ShardingSphere ElasticJob 是面向互联网生态和海量任务的分布式调度解决方案,由两个相互独立的子项目 ElasticJob-Lite 和 ElasticJob-Cloud 组成。 它通过弹性调度、资源管控、以及作业治理的功能,打造一个适用于互联网场景的分布式调度解决方案,并通过开放的架构设计,提供多元化的作业生态。它的各个产品使用统一的作业 API,开发者仅需一次开发,即可随意部署。</p><p>欢迎大家使用,可以通过邮件或 GitHub issues 参与讨论。</p><p>GitHub: <a href="https://link.segmentfault.com/?enc=INPLXUIz8wGvoKr9r0kY1A%3D%3D.Yxc1vpyiAYOsdNAb4WtORyzl1KQ6m0dY%2Fca%2Bw%2F45CF3InPj3Fc2y0nctQPYNi926r%2BwyzKVtmM2xcTVkywrGwA%3D%3D" rel="nofollow">https://github.com/apache/sha...</a><br>邮件列表: <a href="https://link.segmentfault.com/?enc=EpZDfXep8VaaTpu73Tvvfw%3D%3D.579aVDE4eJShu4hKjI7Tf1noq1vp%2BNjWD0pAM%2FHI9Es3kNU7xNYhfPpEM857cM7hE9XfcfW8myX4Y5uujq4CuWHmgRqiDuqrbpb8RmXHibw%3D" rel="nofollow">https://lists.apache.org/list...</a><br>官网: <a href="https://link.segmentfault.com/?enc=72ognYdDIp%2BLm0z3JqARzQ%3D%3D.mXENvOXPaLUFA9co7JrGln3ek7Hg%2BYvy%2BZ1sGq6vowp4w24U7gzmo42o%2BoZm3KNq" rel="nofollow">https://shardingsphere.apache...</a></p><hr><h4>关于 ApacheCon</h4><p>ApacheCon 是 Apache 软件基金会的官方全球会议系列。自 1998 年以来,ApacheCon 一直吸引着各个层次的参与者,在 350 多个 Apache 项目及其不同的社区中探索 "今天的明天技术"。在 2020 年和 2021 年,ApacheCon 活动通过会议、主题演讲、真实世界的案例研究、社区活动等,以虚拟的方式展示无处不在的 Apache 项目和新兴的创新,所有这些都是在线的,而且是免费的。欲了解更多信息,请访问 <a href="https://link.segmentfault.com/?enc=hBPXFBUC4sW%2FiqAV8BCiZw%3D%3D.VtZOMSdb4hOQWPUiq%2FEhWG3833J0a81H6E2vFxxAr8c%3D" rel="nofollow">http://apachecon.com/</a> 和 <a href="https://link.segmentfault.com/?enc=g0rmKXQ65wsnRbzKJqENqw%3D%3D.i2AhmmYzOD%2FHdoCTlC3ghWeU7hSULTvRjwl8LsJdrzQ%3D" rel="nofollow">https://twitter.com/ApacheCon</a> 。</p><h4>关于 Apache 软件基金会 (ASF)</h4><p>Apache Software Foundation 成立于 1999 年,是世界上最大的开源基金会,管理着 2.27 亿多行代码,并向公众提供价值超过 200 亿美元的软件,而且 100% 免费。ASF 的全志愿者社区从最初的 21 名创始人监督 Apache HTTP 服务器发展到 850 多名个人成员和 200 个项目管理委员会,他们通过 ASF 的 "The Apache Way "与 8200 多名提交人合作,成功领导了 350 多个 Apache 项目和计划。Apache 软件是几乎所有终端用户计算设备的组成部分,从笔记本电脑到平板电脑再到企业和关键任务应用的移动设备。Apache 项目为大部分互联网提供动力,管理百万亿字节的数据,执行兆位数的操作,并在几乎所有行业中存储数十亿的对象。商业上友好和宽松的 Apache 许可证 v2 是一个开放源码的行业标准,帮助启动了数十亿美元的公司,并使全世界无数的用户受益。ASF 是一个美国 501(c)(3) 非营利慈善组织,由个人捐款和企业赞助商资助,包括 Aetna、阿里巴巴云计算、亚马逊网络服务、Anonymous、百度、彭博、Budget Direct、Capital One、Cloudera、Comcast、Confluent、Didi Chuxing、Facebook、谷歌、Handshake、华为、IBM、微软、Namebase、菠萝基金、Red Hat、Reprise 软件、Target、腾讯、Union Investment、Verizon Media 和 Workday。欲了解更多信息,请访问 <a href="https://link.segmentfault.com/?enc=zOZcrFqJTnVLOWVV3%2FBOjw%3D%3D.11RuVnAYG4h5r5Na9N7eueYDZQq7FShPKjERhYVDeT0%3D" rel="nofollow">http://apache.org/</a> 和 <a href="https://link.segmentfault.com/?enc=YKDCW98EvxOqHERKWAaNtw%3D%3D.Q6WBCYLaJizWcERgIHaMR7RB0JKJqYe42Mw5zu6ir40%3D" rel="nofollow">https://twitter.com/TheASF</a> 。</p><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=Cn%2BGMGbwNUUb9cub%2FPXd7g%3D%3D.3qVPHziiLEzvB1OSVpxaFo90Mz3rTtyem%2BGBd27OVqktzCQRjaBFxy0nD%2BWZAnACO7UiT6u79dDgWA9HL1jp%2FQ%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=wwtEkt27RPDhFii0XGKylQ%3D%3D.qO658%2FkhWaNI7J0F5ioHLKleYpR8sG66SktMXfDy8yqn0rGapBSxDab%2FqsZAEMzz" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>中国唯一一位女性 Apache Member 潘娟:我们还是要走出自己与众不同的 My Wayhttps://segmentfault.com/a/11900000403523902021-07-15T15:15:37+08:002021-07-15T15:15:37+08:00思否编辑部https://segmentfault.com/u/writers2<blockquote><strong>The Apache Way 是一种参照,但我们还是要走出自己的与众不同的 My Way。———潘娟</strong></blockquote><p>ApacheCon 是 Apache 软件基金会(ASF)的官方全球系列大会。作为久负盛名的开源盛宴,ApacheCon 在开源界备受关注,也是开源运动早期的知名活动之一。</p><p>早在 1998 年,在 ASF 成立之前,ApacheCon 已经吸引了各个层次的参与者,在 300 多个 Apache 项目及其不同的社区中探索 "明天的技术"。也是在这一届上,开发 HTTPD 服务的开发者们欢聚一堂,并决定成立 Apache 软件基金会。</p><p>ApacheCon 每年举办一次,一般在欧洲或北美举行,是 Apache 开发者们线下交流、讨论、见面的绝佳机会,也是分享想法、思想激荡的难得的场合。通过动手实作、主题演讲、实际案例研究、培训、黑客松活动等方式,展示 Apache 项目的最新发展和新兴创新。</p><p>今年,为了更好地服务于亚太快速增长的 Apache 用户和贡献者,ApacheCon 组委会以及 Apache 软件基金会很高兴地宣布,首次针对亚太地区时区的 ApacheCon 在线会议 ApacheCon Asia 大会将于 2021 年 8 月 6 日至 8 日在线举行。</p><p>为了让大家进一步了解开源、了解 ApacheCon Asia,SegmentFault 思否将采访部分 Track Chair 或大会讲师,让你了解大会筹备的背后,和这些专家大牛们的故事。</p><p>今天,我们为大家带来的是,我们对中国唯一的女性 Apache Member 潘娟的访谈。</p><p><img src="/img/bVcTt1c" alt="" title=""><br>以下为 SegmentFault 思否对潘娟的访谈内容:</p><h3><strong>关于潘娟</strong></h3><p>我在开源的身份是中国唯一的一位女性 Apache member,是 ShardingSphere 项目的 PMC,也是 Apache brpc 的 mentor。工作方面的话是 SphereEx 的 co-founder,SphereEx 作为开源 infra 商业科技型公司,欢迎热爱开源,关注分布式数据库/中间件/治理的同学加入!</p><hr><h3><strong>潘娟初次接触开源的故事</strong></h3><p>初次接触开源是在 2018 年初,当时我就职于京东,公司想把 ShardingSphere 这个项目推到 Apache,它当时在开源界已经有一定声望了,但还是没有很好的社区合作的模式,那我们就把它推进了 Apache,这就是我的开源之旅。</p><hr><h3><strong>在参与开源并且为 Apache 社区做贡献的时候,个人及公司有哪些收获?</strong></h3><p>收获其实有很多,从我个人来讲,在开源和技术方面沟通交流的机会变多了,包括用 GitHub 的方式和代码的方式去交流、交友,并且不断地扩大我个人以及项目的视野和发展途径。另一方面,我们在开源中也做得越来越好,所以我们成立了自己的开源商业化的商业公司。总的来说,开源对我个人、开源项目,以及我的公司都有一个非常大的促进作用。</p><hr><h3><strong>潘娟理解的“The Apache Way”?</strong></h3><p>提到这个大家可能第一时间都会想到 Apache 官网阐述的那几个点,从我个人角度出发,我也是拥护 Apache 官网阐述的“The Apache Way”,我觉得它是一种指导的方针,也是一种方法论,我们不一定要百分百的符合每一条,但它是每个项目、每个导师、每个开源人进入 Apache 基金会的指导思想。我也觉得每个项目和每个开源人实践 The Apache Way 的时候,都会产生很多不同的实践经验,所以我觉得 The Apache Way 是一种参照,但我们还是要走出自己的与众不同的 My Way。</p><hr><h3><strong>潘娟与 ApacheCon Asia</strong></h3><p>我是 INCUBATOR TRACK 的出品人,如果大家看了 INCUBATOR TRACK 的介绍,就会发现我们有很多主题,首先我们邀请的是 Apache 孵化器主席、Apache 基金会成员、Dubbo & RocketMQ 等开源项目的导师 Justin Mclean,他给大家带来的主题是:如何在 INCUBATOR 项目里进行正确的发版?内容里会有很多干货,对于所有进入 Apache 的项目是非常重要的。之后会有已经毕业的 DolphinScheduler 和 APISIX 两个项目,它们会介绍一路走来自己社区的 Apache Way,我觉得这也很有意义。接下来的主题都是 INCUBATOR 正在孵化的项目,它们会介绍一些现阶段的一些技术,以及如何治理社区的一些方式,包括关于大数据、Key Value 存储的技术,这对大家想了解技术方面的转型,或者是 INCUBATOR 项目如何孵化都会有所帮助,所以我很推荐大家去关注 INCUBATOR 这个 TRACK。</p><hr><h3><strong>和我们一起加入 ApacheCon Asia!</strong></h3><p>As the Incubator track chair, please have my big welcome to join this wonderful open-source event!</p><hr><p><strong>关于 SphereEx</strong></p><p>SphereEx 是一家致力于构建新型分布式数据基础设施的公司,秉承开源、共享、生态、平台理念,致力数据领域前沿技术创新。</p><p>创始团队成员主要来自 Apache 顶级项目「ShardingSphere」。如果你热爱开源,乐于挑战,那就快加入我们吧!</p><p>投递邮箱:<a href="mailto:hr@sphere-ex.com">hr@sphere-ex.com</a></p><hr><h4>关于 ApacheCon</h4><p>ApacheCon 是 Apache 软件基金会的官方全球会议系列。自 1998 年以来,ApacheCon 一直吸引着各个层次的参与者,在 350 多个 Apache 项目及其不同的社区中探索 "今天的明天技术"。在 2020 年和 2021 年,ApacheCon 活动通过会议、主题演讲、真实世界的案例研究、社区活动等,以虚拟的方式展示无处不在的 Apache 项目和新兴的创新,所有这些都是在线的,而且是免费的。欲了解更多信息,请访问 <a href="https://link.segmentfault.com/?enc=Ivv54G08Xa329f56C8Dvgg%3D%3D.TwrF0KXhZHjh1AztKnoxF%2BwZ7gbdYoNpmRfI%2FH1FLDY%3D" rel="nofollow">http://apachecon.com/</a> 和 <a href="https://link.segmentfault.com/?enc=wvJfKlybImEr60JMxB%2BumA%3D%3D.rmeGTy7AocAu%2B0vgDC2Bf%2FKrzNQGQ%2FPSOpzGScOjTPQ%3D" rel="nofollow">https://twitter.com/ApacheCon</a> 。</p><h4>关于 Apache 软件基金会 (ASF)</h4><p>Apache Software Foundation 成立于 1999 年,是世界上最大的开源基金会,管理着 2.27 亿多行代码,并向公众提供价值超过 200 亿美元的软件,而且 100% 免费。ASF 的全志愿者社区从最初的 21 名创始人监督 Apache HTTP 服务器发展到 850 多名个人成员和 200 个项目管理委员会,他们通过 ASF 的 "The Apache Way "与 8200 多名提交人合作,成功领导了 350 多个 Apache 项目和计划。Apache 软件是几乎所有终端用户计算设备的组成部分,从笔记本电脑到平板电脑再到企业和关键任务应用的移动设备。Apache 项目为大部分互联网提供动力,管理百万亿字节的数据,执行兆位数的操作,并在几乎所有行业中存储数十亿的对象。商业上友好和宽松的 Apache 许可证 v2 是一个开放源码的行业标准,帮助启动了数十亿美元的公司,并使全世界无数的用户受益。ASF 是一个美国 501(c)(3) 非营利慈善组织,由个人捐款和企业赞助商资助,包括 Aetna、阿里巴巴云计算、亚马逊网络服务、Anonymous、百度、彭博、Budget Direct、Capital One、Cloudera、Comcast、Confluent、Didi Chuxing、Facebook、谷歌、Handshake、华为、IBM、微软、Namebase、菠萝基金、Red Hat、Reprise 软件、Target、腾讯、Union Investment、Verizon Media 和 Workday。欲了解更多信息,请访问 <a href="https://link.segmentfault.com/?enc=4Bk2nFEBpb2a2DoGZe9GYw%3D%3D.x4JnOsmsoHuPf%2FnMdCM23O5u1ghZa8nUe54iYN7pOFU%3D" rel="nofollow">http://apache.org/</a> 和 <a href="https://link.segmentfault.com/?enc=isay5NyBD3JrvN9hTx5NGg%3D%3D.MmLG%2Fl0K6QDVR5CSs0bilFT5whkBtVY1sSoXScK2EoQ%3D" rel="nofollow">https://twitter.com/TheASF</a> 。</p><p>ApacheCon Asia 完整议程地址:<br><a href="https://link.segmentfault.com/?enc=RbKem5sGnzwlAC36VuCVog%3D%3D.OAejM3RxOVwN3YhNVQr87cHfKbljhMPYXL9icMv%2B9eBCT2hnYII3WSsRjutQ%2Fma4QPkEAkG6tBoY11z6v1wnhg%3D%3D" rel="nofollow">https://www.apachecon.com/aca...</a></p><p>即刻注册地址:<br><a href="https://link.segmentfault.com/?enc=ssGitsDTac2PaksHDAQ7oQ%3D%3D.I8uDuZfDplw486xh%2Fi8nabYU%2Bx587y7rGuNHNIU6XqxlOvs8IgnkZwbo7fo0KZFU" rel="nofollow">https://hopin.com/events/apac...</a></p><p><img src="/img/bVcTt10" alt="" title=""></p>专访 APISIX 温铭:「支流科技」再获数百万美金投资,APISIX 快速发展的秘诀https://segmentfault.com/a/11900000401955142021-06-18T11:49:27+08:002021-06-18T11:49:27+08:00鸣飞https://segmentfault.com/u/mf6<p>6 月 18 日,Apache 顶级项目 APISIX 背后商业公司<strong>「支流科技」宣布完成数百万美元的 A+ 轮融资</strong>,本轮融资由<strong>经纬中国</strong>领投,<strong>顺为资本</strong>和<strong>真格基金</strong>跟投。本轮融资将加速支流科技在产品研发、开源社区、生态构建和国际化方向的推进。</p><p>SegmentFault 思否的记者独家专访了<strong>支流科技创始人 & CEO,Apache PPMC 温铭</strong>,我们一起聊了聊他对开源与商业化的理解,和 APISIX 的最新发展与未来规划。</p><p><img src="/img/bVcSOP9" alt="" title=""><br><em>图:温铭在 Dev.Together 2021 中国开发者生态峰会</em></p><h2>APISIX 开源背后:要成为全球最好的 API 网关</h2><p>支流科技成立于 2019 年,是一家提供 API 处理和分析的开源基础软件公司,目前拥有三个核心产品,分别是是云原生 API 网关、k8s ingress controller 和服务网格,三个产品可以相互连接构成解决方案,帮助用户构建云原生体系下网络层的流量处理和分析。</p><p><strong>支流科技也是 Apache 顶级项目 APISIX 背后的商业公司,由支流科技捐赠给 Apache 软件基金会的顶级项目 APISIX 是新一代云原生 API 网关</strong>,提供负载均衡、动态上游、灰度发布、服务熔断、身份认证、可观测性等丰富的流量管理功能。</p><p><img src="/img/bVcSOQq" alt="" title=""></p><p>APISIX 从第一天开始就是通过开源的方式在社区发展,在开源 4 个月后进入 Apache 孵化器,并于 2020 年 7 月毕业成为顶级项目,Apache APISIX 飞速走完孵化到毕业全流程,曾是<strong> Apache 史上最快毕业的顶级项目</strong>。Apache 孵化器主席 Justin 和 Apache APISIX Champion 姜宁曾评价 APISIX 是“最让导师省心的孵化项目”。</p><p>谈到为何开源、为何将项目捐赠给 Apache 软件基金会,温铭说这与当初他们创业的初心有关,“<strong>成为全球最好的 API 网关,进而帮助企业更好地处理业务流量</strong>”。但如果是一个闭源的项目或者只是在 GitHub 上开放了部分代码,就无法让更多的企业和开发者参与贡献,从而没有办法达成最初设定的目标。捐赠给 Apache 基金会也是为了让更多人知道这个项目,并参与到社区中来。</p><p>如今,Apache APISIX 已有来自全球的 <strong>250 位代码贡献者</strong>,共提交了 <strong>4128 个和项目相关的 PR</strong> ,<strong>每个月都会发布一个新版本</strong>,是全球开发者最活跃的 API 网关项目。</p><p>在温铭看来,让社区繁荣的关键并非老生常谈的运营技巧,“手段技巧各家都差不多,关键是能不能把这种有长期价值的事情坚持下去”,从创始人开始投入精力在社区里,和一线用户、开发者保持密切沟通。</p><h2>谈开源与商业化:绝大多数开源项目都不具备商业化价值</h2><p>谈到开源与商业化,温铭直言“<strong>绝大多数开源项目都不具备商业化价值</strong>”,GitHub 上的开源项目成千上万,但是真正能够商业化的项目寥寥无几。开源最初只是,我做了一个工具/项目,我希望让更多人知道、展示给更多人看,我就把源代码开放出来。只有这个工具/项目能够为客户企业创造商业价值时,项目本身才具备了商业化的可能性。</p><p><strong>从软件类型来说,操作系统、中间件、数据库等基础软件更适合开源</strong>,这类软件通常具备较强的不可替代性或企业对其依赖性较强。而应用层的、可替代的产品,如 Microsoft Office、Adobe Photoshop 或很多 ERP 软件就没有开源的必要。</p><p>看以上举例,我们可以发现,闭源并不影响这些公司成为非常成功的商业公司。而对于开源商业公司而言,开源只是手段,但最后也是为了其背后的商业价值。因此开<strong>源和商业化并没有必然联系</strong>,开源也不等于免费。</p><p>谈到国内近两年的“开源热”,温铭也有自己的观点:</p><ol><li>开源热,但<strong>开源其实并不是企业商业化的灵丹妙药</strong>;</li><li><strong>开源写入“十四五”让开源“破圈”</strong>了,也会有更多开发者了解、参与到开源中;</li><li>开源商业公司需要“长跑”,两三年热潮退去后,<strong>能活下来的是“真开源”、能够真正解决用户痛点的公司</strong>,短时间“追热点”没有用;</li><li>开源如今“百花齐放”,<strong>最终 PK 的还是技术硬实力</strong>。</li></ol><h2>来自社区、远程协作、不加班,技术人的创业管理哲学</h2><p>支流科技最早由温铭和王院生联合创办,他们曾是 360 的同事,一起工作了七年时间,都是开源的重度爱好者。</p><p>比较特殊的是 APISIX 和支流科技这家公司几乎同时出现 —— 在开源圈比较常见的做法是,几位好友/同事做了一个开源项目,捐给基金会,获得投资、觉得有发展前景再离职开始创业。而温铭和王院生不同,他们从一开始就认准了这个方向,成立公司、写代码、开源到捐赠给基金会不过半年时间。而成立公司的目的就是为了做 APISIX 的商业化。</p><p>社区和公司同时出现,大概也是因为这个原因,<strong>支流科技有 20 多位员工都来自 APISIX 社区</strong>,他们具备出色的技术能力、协作习惯和默契,具备相似的价值观,认可开源文化。</p><p>记者看到支流科技的招聘中写到“支持远程、不加班”——</p><p>目前支流科技的员工分布在全国 10 个不同的城市,大家通过远程协作的方式办公。这对于工程师的时间管理和沟通能力要求很高,得益于此前大家已经在社区里通过 GitHub、邮件列表等协作过一段时间,对支流科技而言并不算很大挑战。</p><p>关于加班,在温铭看来,钻研基础软件的公司,仅靠长时间工作和加班没有办法解决核心技术难题,需要的是<strong>深层次的思考,更高频地用户沟通,这才是真正的“工程师文化”驱动</strong>。</p><p><strong>来自社区、远程协作、不加班,这大概就是技术人的创业管理哲学</strong>。</p><p>谈到技术人创业,出乎意料的是温铭竟是一位“劝退师”—— 技术人自己创业相对风险较高,而加入一个创始人是技术出身的、高速发展中的创业公司或许才是更好的选择。他笑谈“APISIX 就是个不错的选择,欢迎加入!”(简历投递:wenming@api7.ai)</p><hr><h4>相关阅读:</h4><p>Apache APISIX 已被思否 · 开发者点评收录:<a href="https://segmentfault.com/product/1890000040120734">https://segmentfault.com/prod...</a><br>支流科技 CEO 温铭入选中国开源先锋 33 人:<a href="https://segmentfault.com/a/1190000038597979">https://segmentfault.com/a/11...</a><br>Apache APISIX 思否社区主页:<a href="https://segmentfault.com/u/apache_apisix">https://segmentfault.com/u/ap...</a><br>Apache APISIX 项目仓库:<a href="https://link.segmentfault.com/?enc=poJR7aOabvihcupziqkVHQ%3D%3D.Uc2f5JHCJcyLRMa%2BPBgXIaaDnQRrabvFlS%2Fh66NDZN%2Fbi8SkgEpwhyjcERhvzkbh" rel="nofollow">https://github.com/apache/inc...</a><br>支流科技官网:<a href="https://link.segmentfault.com/?enc=oNvu5038lyDTkG6kvj2vng%3D%3D.LWm9h7LFfSatfciOOpMZ%2BCmeYrbSZwlTIVaip7uPvUg%3D" rel="nofollow">https://www.apiseven.com/zh</a></p>专访 SphereEx 创始团队:获数百万美金投资,接棒 ShardingSphere 打造全新分布式生态https://segmentfault.com/a/11900000399992062021-05-14T10:13:39+08:002021-05-14T10:13:39+08:00鸣飞https://segmentfault.com/u/mf8<blockquote><em>开源基础设施大爆发下,数据库的种类越来越多、场景越来越多,也为用户带来了新的管理和使用难题。ShardingSphere 做的事情是为用户提供一个稳定、统一的接入层,帮助用户用统一的方式去使用碎片化的数据库,发挥各种数据库的长处。</em></blockquote><p>5 月 14 日,数据前沿技术初创公司 <strong>SphereEx 宣布获得来自红杉中国种子基金、初心资本数百万美元天使轮融资</strong>。</p><p>SphereEx 是一家致力于构建新型分布式数据基础设施的公司,其核心贡献的开源分布式数据库中间件生态 ShardingSphere,具备“平台化、可插拔、云原生”等核心技术特点,是大规模数据应用、数据增值应用的理想解决方案。</p><p><img src="/img/bVcRZys" alt="" title=""></p><p><strong>SegmentFault 思否的记者独家专访了 SphereEx 的创始成员,Apache ShardingSphere 的 PMC Chair,SphereEx 创始人 & CEO 张亮,和 ShardingSphere PMC,SphereEx 联合创始人潘娟</strong>。我们一起聊了聊他们对开源、Infra、数据库等行业的见解,以及 SphereEx 未来的发展规划。</p><h2>开源 VS 商业:成立公司是为了更好地构建 ShardingSphere 生态</h2><p>作为 Apache 顶级开源项目,<strong>ShardingSphere 已经经过 5 年多的发展,获得超 13K+ stars 的关注,有近 200 余名贡献者,已成为该领域最受欢迎的项目之一</strong>。ShardingSphere 在技术完备性、稳定性,以及社区活跃度方面均处于领先地位,在超过 160 家企业的生产环境中使用,涵盖互联网、金融、O2O、物流、云计算等多个领域,获得了诸多企业级开源用户的认可。</p><p>这次成立商业公司,也是为了能够更好地构建 ShardingSphere 的生态,为用户赋能,SphereEx 创始人 & CEO 张亮向我们介绍 —— <strong>活跃的社区+商业公司的支持其实是一个优秀开源项目的双保险</strong>,大家才可以更放心地去使用它。对于技术能力较强的用户,可以自主去使用开源的版本,通过在社区里的技术讨论构建活跃的开源社区。而对于拥有复杂业务场景、希望获得专业支持的用户,SphereEx 作为 ShardingSphere 背后的支撑,也可以在需要时为用户提供专业的解决方案。</p><p>而谈及公司未来的发展,张亮表示:<strong>ShardingSphere 是 SphereEx 的基石,当前最主要的任务还是组建团队把 ShardingSphere 本身做好</strong>,作为拥有 160 多个模块的开源项目,工作量巨大,下一步才是其他产品的研发和迭代。</p><p>提到开源与商业,SphereEx 联合创始人潘娟补充道,“<strong>ShardingSphere 不会因为商业公司的成立,而放缓或停止社区的发展</strong>。恰恰是因为有了资本的注入,才能够让 ShardingSphere 的开源和社区做得更好。在未来,我们也希望通过开源,建立独有数据使用生态,让更多企业享受到数据增值服务。”</p><h2>机会与挑战:开源基础设施爆发性增长,ShardingSphere 的蓝海探索</h2><p>作为一家早期创业公司,开源基础设施爆发性增长带来的数据库等行业的激烈竞争也令我们担忧,对此 SphereEx 创始人 & CEO 张亮解答了记者的疑问:</p><p>开源基础设施大爆发下,数据库的种类越来越多、场景越来越多,也为用户带来了新的管理和使用难题。数据规模巨大,数据场景多元,架构层代混合,技术演进迅速,如何将底层数据基础平台与上层数据应用解耦,成为各企业数字化转型中的核心痛点。SphereEx 所倡导的 Database Plus (数据库能力增强)、Database Mesh (数据库服务网格)理念,正是旨在提供一种新的思路。遵循这一理念的 <strong>ShardingSphere,做的事情正是为用户提供一个稳定、统一的接入层,帮助用户用统一的方式去使用碎片化的数据库,发挥各种数据库的长处</strong>。</p><p>而无论是数据分片,加解密,还是弹性迁移,其实都是一个垂直领域的内容。不同于数据库领域的激烈竞争,<strong>ShardingSphere 其实目前并没有太多的竞争对手,所在领域是一个蓝海</strong>。</p><p>谈到竞争格局,SphereEx 团队也很有信心,SphereEx 联合创始人潘娟向我们介绍,ShardingSphere 的核心优势主要体现在三个方面 ——</p><ul><li>ShardingSphere 做在的分布式数据库领域,是各行各业都要用到的,因此<strong>在基础设施的层面,它本就具备坚固的地位</strong>;</li><li><strong>ShardingSphere 有自己独特的架构优势</strong>, Database Plus (数据库能力增强)、Database Mesh (数据库服务网格)理念让 ShardingSphere 不再是一个单独的分布式数据库解决方案,而变成了分布式数据库行业的生态。</li><li><strong>ShardingSphere 是面向开源的</strong>,很多开发者会自主地加入到生态中去,把它打造成业界的分布式数据库领域生态的标准。</li></ul><p><img src="/img/bVcRZyu" alt="" title=""></p><h2>本轮融资将用于团队搭建,关于 SphereEx 的人才观</h2><p>目前 SphereEx 的核心团队,除了 ShardingSphere 的 PMC Chair 和 PMC 张亮与潘娟外,还有一位有多年销售管理经验的合伙人张磊,负责公司的市场运营相关工作。此外部分核心的研发和运营同事也来自于此前张亮和潘娟在京东科技的同事,和 ShardingSphere 社区的核心人员。</p><p>作为刚刚完成天使轮融资的早期创业企业,本轮融资将主要用于团队组建。对 Infra、数据库、开源、治理等领域感兴趣,Go 语言、Java 语言、Mesh、市场运营等方面的人才,都是 SphereEx 正寻觅的对象。</p><p>提到人才招聘,张亮补充道,“我们招聘优秀的人才,不仅希望他们帮助 SphereEx 成长,也希望通过几年的开源实践,<strong>帮助中国开源培养更多的人才,带领更多人才加入开源。</strong>”</p><p>欢迎大家通过 <strong>hr@sphere-ex.com</strong> 投递简历加入 SphereEx,与公司相互成就,实现职业理想与个人价值。</p><hr><p>采访的最后,张亮向我们说起公司品牌名称「SphereEx」的含义,Sphere 是生态的意思,也来自于开源项目 ShardingSphere 这个名字,体现了商业公司和开源项目的一脉相承。而 Ex 则可以理解为 Extension 或 Explore,代表了公司对整个生态的的扩展和探索。</p><p>我们也期待看着逐渐走向成熟的 ShardingSphere,和尚年轻的 SphereEx 可以不断发展,带着无限探索的精神,在挖掘数据库生态的道路上乘风远航。</p><p><img src="/img/bVcRZMa" alt="" title=""></p><h3>相关阅读</h3><p><a href="https://segmentfault.com/a/1190000038597979">SphereEx 联合创始人潘娟入选《2020 中国开源先锋》</a></p>专访 Tetrate.io 创始工程师吴晟:开源领域需要 40+ 的开发者,也需要更张扬的年轻人https://segmentfault.com/a/11900000397166442021-03-26T10:16:04+08:002021-03-26T10:16:04+08:00思否编辑部https://segmentfault.com/u/writers8<p>不久前,「一源初始,开放共创」开放原子开源基金会 2020 年度峰会于北京圆满落幕。峰会由开放原子开源基金会主办,阿里巴巴、百度、华为、趣链科技、SegmentFault 思否、招商银行等开源项目代表单位及开源社区协办,亦得到了全体理事单位的大力支持。</p><p>会议中,Tetrate.io 创始工程师、Apache Member、Apache SkyWalking 创始人吴晟进行了主题分享,并参与了开源运营治理分论坛的圆桌讨论环节。在分享中,吴晟提出了对国内开源环境以及开源和商业间的思考。SegmentFault 思否对吴晟进行了专访。</p><p><img src="/img/bVcQOgC" alt="image.png" title="image.png"></p><h4>Q1:如果需要给“开源”下一个定义,您认为是什么?</h4><p>开源在我的印象中,是一个技术工程师在跨商业实体间合作的平台与机会。在传统的开发模式中,工程师开发的软件只能在公司内部共享,而借助开源,可以和其他公司的人一起来开发、分享。对于工程师来说,这样的开发模式会更有成就感,项目的质量要求相比之前也会高很多。</p><h4>Q2:开源领域有很多角色分工,比如工程师、宣讲者等等,您认为您在开源领域当中的角色是什么?</h4><p>主要还是一个工程师的角色。SkyWalking 最早就是我自己参与开发的项目,所以开发者的身份在我的日常当中占据很大的比例。布道、运营之类的工作也会有一些,但主要是在项目进入 Apache 基金会并顺利毕业之后,会有一些外部活动邀请进行相关的经验分享。</p><h4>Q3:现在比较普遍的一种认知是,开源的参与者不只局限于开发者。您觉得各种角色的加入对开源来说会造成哪些促进或影响?</h4><p>其实就像一个软件公司,除了开发者之外也是包含很多其它角色的。比如宣传市场、售前售后等等,但无论是哪一种身份,大家都是抱着同一个目的,在为同一个产品或开源项目在服务,在合作共建。</p><p>开源只是将这件事情放大了,把公司里由几个人干的事情进行更广泛的分工,找到更多擅长的人来一起完成。因为不可能一个人什么都会,需要有不同身份的角色参与其中。</p><h4>Q4:能否分享一下您对国内开源领域的看法?</h4><p>国内开源领域有一个现象,是大家现在看到了开源背后的更明确的商业价值,所以有点“一窝蜂式”的涌入。</p><p>这个现象的结果可能跟其它所有行业一样,在“一窝蜂”的涌入后,会在一个时间内变的非常繁荣,但到了下一个阶段,其中有一部分人可能会被淘汰掉。但泡沫总是会破灭的,能剩下的才是那些真正务实的项目和人。</p><p>开源项目的核心是为了解决一个具备通用性的问题。如果项目真的能解决一批人的问题,那不管泡沫破不破灭,它都会一步一个脚印的活下来。但如果单纯是靠造势、造泡沫发展起来,就会长得快破的也快,项目很快也会被大家忘掉。</p><h4>Q5:您认为开源与商业间的关系是什么?开源项目应该如何协调与商业间的关系?</h4><p>我最近在和 PingCAP 的朋友聊天中,谈到一个很有共性的思考。</p><p>以前的开源项目有几个发展阶段,最开始会是卖所谓的商业版产品,但这种方式在今天的成功率已经很低了。做开源项目的商业版,意味着会“藏”一些东西。但“藏”这个事情对于开源领域来说是很反感的,用户会认为你只是开源了一个玩具,开源出来的项目本身就没有多少价值,也会和商业版产生竞争关系。</p><p>比如你将一些功能“藏”了起来,外部的项目贡献者为你提供了一个一模一样的功能,你就需要考虑是否要将这项功能合并进来,如果不合并又需要用什么样的理由去拒绝。</p><p>所以现在最典型的开源模式就是像 RedHat 一样的全开源,项目功能全部都是开放的,只售卖咨询服务。全开源保留的只是“人”。写项目的人是我的,所以我在这个项目中最专业、最擅长。</p><p>第二种就是卖云服务。云服务应该是现在相对比较好挣钱的方式,但也有一定的门槛。比如说太小的开源项目或者太组件化的项目就很难售卖配套的云服务,而偏产品化的产品就相对比较好卖。</p><p>第三类在国内还相对较少,就类似于我们在北美的那家公司一样,做的是一个商业产品,但产品 95% 以上的功能都是来自几个不同的顶级开源项目。我们把它们“捏”在一起为客户解决一个实际的场景需求,提供了一个完整的商业产品。</p><h4>Q6:您觉得什么样的企业适合参与开源?</h4><p>我之前接触过各种各样的企业,如果要细分的话,如果一家想要主导开源,或者想要新做一个开源项目的话,企业一定要具备“技术范儿”,是一个技术导向的企业。</p><p>我们可以看到国内很多互联网企业开源的很多东西,可能过了两三年就没人管了。本质上开源的目的是因为内部需要,但很长时间没有进行改进,外部也只是拿走去用,然后开源项目的热度就慢慢降下去,没有人再使用了。这是一个最常见的情况。</p><p>另外一种,如果只是参与开源,那门槛其实就没有那么高。只要是自身也需要这个领域的东西,无论是使用还是贡献其实都是参与的一种方式。</p><h4>Q7:企业开源项目两三年后便不再维护的原因,一般都有哪些?</h4><p>没有找到商业化路径肯定是原因之一,没有利益驱动会导致后续不再投入成本进行维护。</p><p>第二种常见的现象是国内互联网公司的一个特性。很多公司的员工从一个职级晋升到另一个职级时,开源项目会是一个评估指标,所以很多工程师会利用工作时间和业余时间来完成这个指标。但随着两三年后的晋升成功,到了下一个级别的情况就不一样了。国内很少有高职级的纯工程师,基本上华为 20 级以上、阿里 P8 以上的时候,很难会有沉下心来写代码的工程师。</p><p>到了这种级别就需要分出一部分精力参与项目合作、市场宣传、管理等等,而开源项目的发展必然就会受到影响,甚至死掉。</p><p>但其实很多所谓的“KPI 开源项目”都是好项目,也有很多人用,也能解决很多实际的问题。但问题就是缺乏延续性,给大家一种感觉就是国内没有“开源大项目”。没有历史悠久、在领域内耕耘多年、特别资深的项目,国内这样的项目确实是比较少的。</p><h4>Q8:您认为基金会的出现和介入,对这种情况是否能有所改善?</h4><p>这个和基金会的运作模式有关系,也就是基金会模型的问题,比较典型的就是 CNCF 和 Apache 之间的区别。</p><p>如果一个项目捐献到 Apache,如果社区没有建立好,初始的人离开项目还是很容易死掉的。CNCF 也类似,会要求 3-4 家公司成为项目的主要构建者,如果少了一家公司可能不会对项目造成太大的影响,如果再少一家公司,情况可能就不同了。</p><p>基金会只是一种组织形式,可以让大家放掉很多顾虑。不会出现一家公司影响项目生死的情况,但项目的具体发展,即使是在 Apache 或者 CNCF 这类基金会中也有很多不那么成功的项目,包括我自己在 CNCF 中有一个参与了的项目,就做的很不成功。虽然那个项目做了铺天盖地的广告宣传、有名厂站台,但项目本身不是非常被市场需要,并没有预期中那么有用。</p><p>包括像我们这种最早的项目参与者,认为这个东西好像挺有用的,可以解决很多的问题,但随着深入,大家都觉得这个产品似乎并没有那么好,事实上的效果也没有达到预期。</p><p>所以项目会起到决定性的因素,如果项目不好,哪怕是最顶尖的工程师来操刀、加入最顶尖的基金会,该做不起来还是做不起来。</p><h4>Q9:您觉得对于开源项目有没有一些评判标准?</h4><p>最关键的就是项目的主人或核心贡献者,他们最清楚项目的价值与优劣。</p><p>往往我们在评价别人的开源项目时,会有很多空子可以钻。比如说 Star、Fork、Watch、Contributer、提交频率、issue 解决时间等等,这些都是有空子可钻的。尤其是对开发者来说,各种接口都摆在那儿,找到规律之后甚至都不要人来具体执行。</p><p>所以评价项目是不是真的有价值的重点,是有没有那么多人或者厂商,真的基于自己的需求在不停的和项目之间进行沟通、相互提高。如果能在项目中看到这种情况,那么这个社区可能就是成功的。哪怕有很强的商业背景、很强的 KPI 背景,只要用户认可,认为这是一个好项目,贡献者也认为这个项目符合我解决特定问题的思路,我们就会把这个事情干好。</p><p>我们举个最简单的例子,比如一个知名厂商开源的系统可以在一夜之间吸引到 1000 个工程师,吸引到 1000 个 contributer ,但另一个项目可能只有两三百位贡献者,不过都是真正有需求的用户,这两个项目的社区活跃性、体系化和延续性,都有很大的差异。后者实际上要强大的多。</p><p>不同的项目贡献者的数量肯定也是不一样的,如果是一个全套的 IT 系统,那么覆盖的人群就会非常广,而另一个项目可能只是其中某一个非常具体化、细节化的需求,覆盖的人群就会相对少很多。所以不能单纯从数量来作比较,还要考虑一个市场占比的问题。</p><h4>Q10:SkyWalking 作为一个顶级的开源项目,成功的关键因素是什么?有哪些环节您认为做的比较好?</h4><p>最重要的一点是大家真的需要这样的一个产品。SkyWalking 没有专职的 Marketing 同事,相对其他项目在宣传、包装之类的方面做得非常少。</p><p>我们还是希望好好的做技术,和研发人员打成一片。只要真的愿意来贡献,我们就可以深入探讨如何将这个事情做好。</p><p>下一步的计划比较清晰,要涵盖监控领域绝大多数的场景。</p><p>最早的阶段 SkyWalking 只做追踪这一块的业务,后来增加了拓扑图分析、Metrics计算、API 监控、Service Mesh、日志监控等等。我们会推出更全面的解决方案,也是因为看到一些贡献者有这样明显的倾向。</p><p>当初最难的问题我们解决了,现在大家希望的是将工具都能往这个上面来靠,将一些相对陈旧的东西迁移到最新的产品当中,保证平台的唯一性。</p><p>从项目本身来看,我们在 Agent 和 Mesh 做的最好,最核心的重点肯定会在这个方向,但从社区来看,是有这样的一个趋势。</p><h4>Q11:国内外的开源社区,在运营模式和发展方向上是否存在一些区别?</h4><p>主要的区别有两点。</p><p>第一点是参与者的专业性。国外有很多专业的“开源玩家”,在他们的职业生涯中可能碰到过 2、3 个成功的顶级开源社区或者开源项目,在做一个新的开源社区时会更加得心应手,不会走弯路。</p><p>第二点是团队作战,这在国内是最难的一件事情。我们的开源项目没有跨实体的集团做的,都是一两个人或者一家公司,在对抗国外可能是五家十家全球顶级企业开发的项目,在对抗一个行业。</p><p>国外很多行业都有一种私下的“君子协定”,他们会在同一个航道中走,而如果想跳出这个航道或者做一个平行航道,那就会不在同一个水位线上,很容易被对方淹没。</p><h4>Q12:有哪些技术领域,国内可以通过开源来占据一些地位?</h4><p>我们还是举 SkyWalking 的例子。在最开始做这个项目的时候,绝大多数人对 API 都不太了解,但国外做的其实是非常强的。我们要考虑的几个点是自己能不能走得出去。</p><p>全球化社交对中国来说是一个硬伤,这并不单纯是语言的问题,更多还是一个大的生活习惯和文化环境导致的。我们国家幅员辽阔,在大家的概念中出国永远都是一件“大事”,包括我之前所在的公司,出国参加一个会议,审批都要比国外多好几级。</p><p>但有些时候,出国甚至比国内出差在地理距离上还要近,比如去日韩、东南亚之类的,并且出国也很方便,但我国企业在这些地方发展的还是很有限。除了一些出海产品走出去了,但缩小到技术领域来看就更少了。</p><p>比如在东南亚和印尼,当地的技术活动是很多的,但中国没有机会去互相沟通、交流、推广开源解决方案等。我们可能需要先把这个壁垒打破,技术反而不是第一个致命的问题。</p><p>现在的问题是我们有好技术,但推不出去,是被迫在国内搞。而大家又会因为你的项目只在国内活跃,大家就会担忧你的盘面会不会太小、不被国外企业厂商接受。</p><p>现在行业内有一个共识,就是不能只在国内市场发展。短期可以,但可能不会做的太长久。</p><h4>Q13:解决国内开源问题,最重要的一步是什么?</h4><p>我的想法是“一上一下”。</p><p>大家都在讨论开发者 35 岁或者 40 岁会是一道鸿沟,我觉得这在短期内确实很难避免,毕竟这和国内很多企业实际的运营情况相关。“上”就是指 35 岁以上、40 岁以下的工程师能不能有更多的人留下来,企业给他们更大的空间去写代码?</p><p>我有一个感受,在国内大家可能觉得我是一个资深的工程师,但每次出国参加活动我都是最年轻的。国外有些工程师可能代码已经写了 40 年,头发都白了。之所以坚持下来,也许他挣得足够多,也许他只是单纯的喜欢,但那个环境给了他这样的一个机会。</p><p>我们在日常的项目运营中,看到很多年轻工程师有精力、有一腔热血,但做事情很容易走错方向,因为行业经验太少了,是按照以往的经验来干活,不知道前面可能有一些什么样的坑在等着。</p><p>但假如有这种 40 岁以上的开发者能帮他们指出问题,就可以少走弯路。哪怕他们的代码量不多,但代码质量相对来说一定会是很好的,并且更能沉得住气来解决问题,更能接受长线的运营项目,就像中国的第 N 个五年计划一样。我觉得这是对高年龄程序员的一个定位。</p><p>我非常愿意看到有一天,当我们在 coding 的时候既有年轻人,也有资深年长的程序员,</p><p>“一下”,指的是学生群体。现在很多老师已经做了很多工作,所以这部分的发展比上面的发展要好很多。我经常能看到很多新鲜血液,比如 SkyWalking 的群里就有高中生。虽然我们的项目是个工业项目,不知道对他来说会怎样使用,但能吸引年轻人的重视,是一件很好的事情。</p><p>现在大家都很重视年轻人,无论是媒体、政府还是厂商,都非常重视对于学校的布道,只要我们把该讲的讲对了,别布错了方向,那我觉得这部分之后的发展,问题不大。</p><h4>Q14:您觉得给年轻群体推广开源文化,有哪些需要注意的点?</h4><p>我觉得要让我们的学生更张扬一些。我喜欢现在的一些 90 后,能在文字的环境中表现出张扬的一面,但我希望他们能够再张扬一些。</p><p>你要相信你的观点和观念,真有经过讨论和学习,确认别人的观点更好或者更准确的情况下,再去放弃自己的观点和观念。但无论如何,都要能站出来,持续的表达自己的观念。现在能看到很多大学生观念很强,但对于维护自身观念的坚持不够。</p><p>第二点就是需要给学生更多上台的机会。我国的教育常年造成的一个现象是没有人愿意站在台上讲,一上台就会跑掉一半的人。做卷子可以、写文章写邮件文字采访可以,但如果要上台讲个 10 分钟,那分享的东西可能就乱套了。</p><p>国外的学生因为教育的原因,在个性方面相对会更加张扬,更能在公开场合坚持表达自己的观点。SkyWalking 有一个 90 后的贡献者,他就是那种知道自己经验不足但会坚持表达的人,这样才可能做出一些之前想不到的事情。比如他把 SkyWalking 集成到了 IDE 中,在源代码中就可以看到指标,这个思路就很特别。</p><p>这就是年轻人的独特价值,是 40 岁的开发者提供不了的。但 40 岁的开发者可以保障你的奇思妙想得到很好的、快速的实现,避免走偏路。</p><p>只有“上下”都发展起来,整个开源的队伍才能建立起来。现在开源领域大部分的开发者工作年限可能也就是 5、6 年,虽然也能在一些项目中看到一些 40+ 的开发者,但他们大部分都是没有开源经验的。国内这方面的发展可能确实还需要再熬一熬、等一等。</p><p>开放原子开源基金会在开源领域开了一个先例,我们虽然不能指望有什么快速的产出,但他给了我们一种可能性、一个靶子。给了我们一个去做比较、去发现问题的方式。</p><p>基金会中第一批开源的项目,我们不能下定义它们是否会成功,但无论结果如何,在发展的过程中会有很多教育和借鉴的意义,这可能是最有价值的地方。</p><hr><p><img src="/img/bVcQNsI" alt="segmentfault 思否" title="segmentfault 思否"></p>专访中科院副总工程师武延军:“参与开源人数变多是好事,但要小心「开源踩踏事件」”https://segmentfault.com/a/11900000397113322021-03-25T14:27:50+08:002021-03-25T14:27:50+08:00思否编辑部https://segmentfault.com/u/writers11<p>不久前,「一源初始,开放共创」开放原子开源基金会 2020 年度峰会于北京圆满落幕。峰会由开放原子开源基金会主办,阿里巴巴、百度、华为、趣链科技、SegmentFault 思否、招商银行等开源项目代表单位及开源社区协办,亦得到了全体理事单位的大力支持。</p><p>本次峰会围绕开源运营治理、开源教育与公益等方向开展了主题论坛分享。会议中,来自中国科学院软件研究所的副总工程师武延军以《开源操作系统和开源软件供应链的教学实践》为主题进行了分享。在大会上,武延军提到了开源软件供应链面临的三个主要问题:产业价值不高、社区贡献不足、生态受制于人。</p><p>为了进一步了解开源软件供应链的定位与目标,以及有哪些举措可以解决我国开源软件领域的困境等问题,SegmentFault 思否对武延军老师进行了专访。</p><p><img src="/img/bVcQMP5" alt="专访 - 武延军" title="专访 - 武延军"></p><h4>Q1:开源领域有很多角色分工,比如宣讲者、推动者等。您认为您在开源领域中的角色是什么?</h4><p>我觉得我更像是教育工作者。科研院所本身具有培养学生的职能,目前全所有 500 多名学生,每年会新吸纳 100 多人,我们有责任把这些人往开源软件的大模式上去引领。</p><p>之前大部分人对开源还没有太多概念,包括像开源社区的运作模式、开源软件的开发模式、开源规则背后的理念,可能都没有太多理解。我们作为教育者把这些都教给学生后,对他们后续从事科研工作,是有很大帮助的。</p><p>对此我们也进行过一些实践,比如我们在实验室内部长期维护一份新生新员工指导手册,我们会推荐学生去看一些开源入门项目,比如 GitHub上 有个「first contribution」项目,可以教大家如何第一次为开源做贡献。</p><h4>Q2:是否会涉及帮助学生分析、挑选开源项目的内容?有没有一些基本标准?</h4><p>中科院的研究生基本第一年都在集中上课,第二年开始参与科研,第三年要开始找工作,算下来只有一年多的时间在专心做科研。从学生培养角度来说,我们有义务尽早告诉他们哪些开源项目是高质量的、有价值的、参与其中对他们的成长是有益的。</p><p>还有一个重要维度,是哪些开源项目对产业有帮助,甚至更大意义上说是哪些项目对解决国家面临的“卡脖子”问题是有帮助的。两者如果能结合在一起是最好的一种方式。</p><p>这也是软件所发起开源软件供应链点亮计划的初衷。我们希望从供应链的角度去分析哪些项目有价值,或者处于有风险的状态。</p><p>一个开源项目可能被很多工业级产品使用,但是有可能我们国家现在还没有人去参与,也没有人能掌握。如果这个开源项目出现了缺陷漏洞,或者后续版本不开源了,在这种情况下我们应该有人去把它承担起来,而不是一直“拿来主义”。</p><p>所以我们要把学生尽可能的引导到有价值且对产业有贡献的开源软件上,让他们既能完成自己的学业,学到有价值的东西,同时也能解决社会和国家的问题。</p><h4>Q3:您认为学生群体在开源生态中是一个什么角色?</h4><p>相对来讲,学生没有功利性和目的性,自我成长的意愿比较强,所以他们在社区里的活跃度会比较高。虽然不一定是贡献最多的,但在一定程度上确实可以推动社区的活跃度。</p><p>第二点来说,学生类似于接班人的角色。新生力量对开源的参与融入,意味着很有可能他将来走向工作岗位后会优先使用开源软件,使用开源社区中的开发模式,将开源文化带到他的工作当中,最后潜移默化的变成开源推广者。</p><p>培养学生参与开源的过程像是制作火种。学生开源群体就像火种一样,先是慢慢的被点燃,接着到更广阔的空间中去发光放热。</p><h4>Q4:您认为开源的核心价值是什么?</h4><p>首先我认为开源是人类社会共享互助精神在数字时代的体现,并在互联网的催化下将这种精神发扬光大。</p><p>第二点我认为开源是一种非常棒的人类文明薪火相传的模式。一个成果如果垄断在一个人或者一个团队手中,成果的传承会有非常多的不确定性,但开源可以将成果一直延续下去,实现累进叠加式的发展。</p><p>Q5:您认为国内的开源行业,现在发展到了哪个阶段?</p><p>近几年,特别是从去年到今年这一时期,国内的开源发展非常迅速。以前可能是分散的“点”,现在则形成了“面”。</p><p>具体而言,以前我们零零星星能听到一些国内发起的开源项目,个别开源老前辈也有一定的国际影响力,但并没有形成一种大的社区和生态。</p><p>从今年开始,像 openEuler 这样的开源社区在华为的大力推动下,变成了一个有目标、有组织、成体系的社区。它以操作系统为主线,把上下游生态全部连接起来,很短的时间就吸引到 2000 人以上的活跃开发者,这是以前从来没有过的。</p><p>还有像产学研协作,在以往的开源社区是很难出现的。但今年开源行业一个很重要的特征,便是产学研合作在开源社区里出现了,这将大大缩短学术界与产业的距离。</p><p>如果说以前我们叫游击队式的「开源 1.0」,今年开始可能真的到了正规军式的「开源 2.0」阶段,这是一个非常明显的质的变化。</p><p>Q6:您觉得推动开源发展的力量是什么?</p><p>我觉得跟国际形势变化有很大的关系。以前大家觉得“拿来主义”没问题,能满足商业诉求就可以。但贸易摩擦后,大家发现不能只考虑短期的商业利益,还要考虑业务的可持续性。像华为就是一个最明显的转变样板。</p><p>第二点我觉得可能是疫情的原因。大家在线上的时间变长,数字世界的一些文化自然而然会得到比较广泛的传播。</p><p>很多应用领域的 IT 工程师以前可能知道开源这个词,也接触过Linux等开源产品,但对开源的力量并没有直观感受。今年「武汉 2020」开源项目的出现,让大家一下就明白了——原来开源是通过充分的、自发的协作,让大家一起以共同的信念,去完成一个普通个人无法完成的宏大目标。</p><p>线上会议的普及对开源来说也是很好的推进。以前开源社区里的成员想聚到一起开会很难,但现在大家可以通过线上视频会议的形式来讨论、学习,让更多的人通过线上会议的形式参与到开源当中。</p><h4>Q7:您觉得现在这种发展趋势,对开源来说是一件好事吗?</h4><p>肯定是好事,这种状态如果能够一直延续下去,可能未来几年内我们就会进入到开源3.0阶段。</p><p>开源 3.0 是什么状态?我现在个人预期是,以后在中文世界里中国人主导的主流开源项目会越来越多,然后会以这些开源项目为起点,在世界开源产业里占有一席之地。国内也可能会出现类似于 Red Hat、Snowflake 这类重量级的开源公司,并能在商业上取得成功。</p><h4>Q8:供应链是 2020 年的热词之一。开源软件供应链相比其它领域有什么独特性吗?</h4><p>我觉得独特性体现在两个方面:“软件”和“开源”。</p><p>供应链这个概念在各行各业都有,特别是传统行业供应链已经非常成熟。但对于软件行业,有它本身的特点:迭代周期短、供应全球化、开发线上化、复制成本低、仓储集中化、用户多样化等等。</p><p>其中仓储集中化是一个比较有意思的特点。在没有 GitHub 的时候,每个站点可能都会存储自己的开源项目,但现在开源项目有 90% 以上应该都集中存储在 GitHub 中。这跟传统供应链完全不一样,传统供应链在每个国家、每个港口城市都有自己的仓储系统,但开源软件领域将这些都存放在同一个平台上。这是一个特点,但也可能是一种风险。</p><h4>Q9:您进入操作系统领域已经有 20 年了,您认为开源对操作系统的发展有哪些促进或者影响?</h4><p>开源对操作系统的促进作用是非常大的。回顾 Linux 的发展之路,可以发现它也是在开源运动之后才得到迅速的发展。</p><p>首先从开源操作系统的组成来看,一个主流开源操作系统包含的开源软件包大概有3万多个,是汇集很多人一起才能完成的一件事情。做一个商用操作系统是一件很严肃的事情,这3万多个包都需要保证得到很好的维护,才能进行大规模商用。例如谷歌的安卓系统,软件包和第三方库都是经过长期筛选之后,才变成一个成熟的商用操作系统。</p><p>第二点是从操作系统的推广和使用上来讲,开源操作系统在现阶段用户的接受度会更好一些。相对来说,开源会比较透明和开放,大家不需要过于担心系统的可控性以及数据的安全问题。所以我觉得开源操作系统会是社会未来最认可的一种模式。</p><p>第三点是操作系统的最终属性。从产业角度来看,操作系统已经过了直接盈利的阶段,它可能逐渐会演化为一种社会公共基础品,会成为一种基础设施。</p><p>想基于基础设施本身开展商业行为是很难的,肯定会依托于类似服务订阅的方式。在这种方式下,大家为什么选择你?可能就是要靠广泛的社区认可,靠对开源的贡献程度。</p><p>你在开源操作系统上做的贡献越多,大家可能就越倾向于找你来提供服务。未来操作系统一旦变成公共品,那可能围绕操作系统的商业必须要完全的去拥抱开源,通过对开源的贡献证明自己的实力。</p><h4>Q10:OpenHarmony 是为这种操作系统提供一个生态平台吗?您觉得它对于整个生态有哪些推进作用?或者说它的价值点是什么?</h4><p>我觉得 OpenHarmony 的核心定位也应该是根操作系统社区,跟 openEuler 一样,这样它才能价值高、意义大。</p><p>根操作系统社区作为商业版操作系统社区的基础,可以让商业版节省大量的人力物力,将更多的精力放在满足客户需求上,尽可能的去满足国内现阶段的一些共性需求,然后逐渐走向国际。</p><p>更高一层的意义在于,在当今世界格局下,中国对于操作系统的需求是非常强烈且场景是丰富的、市场是巨大的。我们有理由也应该有能力抓住这个机遇,发展一个属于我们的根社区,吸纳更多的软件包、吸引更多的开源人士、覆盖更多产业需求。</p><p>所以说 OpenHarmony 的意义是巨大的,期待它以后也能起到类似于高速公路、水电站和特高压电网这样基础设施的作用。</p><hr><p>开源正在改变世界,开源软件、开源硬件、开源内容在各行各业有着越来越重要的地位,开源的模式在改变着各个行业的生产方式并大大提高了生产效率,但开源的发展仍需各界人士的积极参与。</p><p>开放原子开源基金会的使命是“一切为了开发者,一切为了全世界”。随着发展,开放原子开源基金会已经展现出了能力与价值。以「开源」为纽带的开放原子开源基金会号召各界人士一起来推动中国的开源事业,基金会愿意持续构建一个开源的生态,帮助大家共建、共治、共享。</p><p><img src="/img/bVcQMRT" alt="segmentfault 思否" title="segmentfault 思否"></p>专访堵俊平:“最好的开源生态模型,是亚马逊的原始森林”https://segmentfault.com/a/11900000390798462021-01-25T10:35:18+08:002021-01-25T10:35:18+08:00思否编辑部https://segmentfault.com/u/writers3<p>2020 年 12 月 27 日,「一源初始,开放共创」开放原子开源基金会 2020 年度峰会于北京圆满落幕。峰会由开放原子开源基金会主办,阿里巴巴、百度、华为、趣链科技、SegmentFault 思否、招商银行等开源项目代表单位及开源社区协办,亦得到了全体理事单位的大力支持。</p><p>本次峰会围绕开源运营治理、开源教育与公益等方向开展了主题论坛分享,开放原子开源基金会首个捐赠项目开放原子可信账本项目组进行了工作汇报路演,广受开源圈关注的开放原子开源基金会技术监督委员会(以下简称“TOC”)也进行了专场分享。</p><p>为了进一步了解基金会的运营思路以及 TOC 在基金会中发挥的作用,SegmentFault 思否的记者对开放原子基金会 TOC 主席堵俊平进行了专访。</p><p><img src="https://image-static.segmentfault.com/214/869/214869063-600e2cc4ddd9a" alt="开放原子基金会 TOC 主席堵俊平" title="开放原子基金会 TOC 主席堵俊平"></p><p><strong>Q1:您觉得基金会对整个开源行业来说,核心价值点是什么?</strong> </p><p>对开源行业来说,企业之间要想破冰建立合作,尤其是具备竞争关系的友商之间是很困难的。</p><p>开放原子基金会作为一个中立的非盈利的机构,不被任何一个公司、一个企业所控制,所以大家进行项目合作的时候可以放下戒心,很容易建立信任,在技术上群策群力,共同促进开源项目的发展。</p><p>回到本质就是说,基金会的存在可以帮助大家更好的建立合作、建立信任。</p><p><strong>Q2:传统的观念当中,企业的商业属性跟开源存在着本质上的冲突。基金会在号召企业参与开源的过程中有没有遇到什么挑战或者困难?</strong></p><p>我觉得企业的运营思路在逐渐转型,我国各大公司对开源的理解也都处于一个逐渐深化的过程。</p><p>开源的第一个阶段,企业的思路是“如何用好开源”;第二个阶段则是慢慢走向贡献开源,加入到开源社区的建设当中。而类似华为、阿里这样的公司,在开源这条路上走的更靠前一些,会借助自身的平台能力,主动开源出一些项目供大家使用。</p><p>我觉得所有的技术企业最后可能都要经过这三个不同的发展阶段。但并不是说发展的越靠前越好,开源需要各种角色参与其中,成熟的体系中一种既有消费者也有生产者,从而形成一种良性循环。</p><p>并且开源的形式也有很多,国外有些公司并没有将项目直接开源,而是将开源云化,进而从中获取利润。虽然这不是传统观念中的开源行为,开源领域对这种方式也褒贬不一,但至少它成功促进了开源项目的推广,也证明开源项目具备商业价值,具备产业化的能力。</p><p><strong>Q3:开放原子开源基金会在促进企业贡献开源、参与开源的过程中,有哪些具体的方式与策略?</strong></p><p>我觉得基金会有几个比较重要的点。</p><p>第一,基金会相对于其他的开源推广组织,最本质的区别是可以托管项目。开放原子基金会作为一个非营利的实体组织,各个企业可以把相应的代码、项目捐赠给基金会。孵化项目作为基金会最重要的职能之一,仍让这些贡献出来的项目按照一种更为公开透明的方式来运行,成为全社会共同所有的一个项目。</p><p>其次,在基金会的运行当中有一整套的原则方法。比如不同的基金会对于成员构成有着不同的要求,Apache 基金会接受企业项目捐赠但要求开发者以个人身份加入项目贡献,而像 Linux 基金会、开放原子开源基金会则以企业捐赠的项目为主,个人项目为辅。让企业以一种会员制的方式进行项目捐赠,这会降低企业参与开源的顾虑。</p><p>这两种模式各有优劣,对开源文化来说都有着积极的促进作用。我们既需要 Apache 的模式,也需要开放原子开源基金会和 Linux 基金会的模式。</p><p><strong>Q4:TOC 在基金会当中担任什么角色?</strong></p><p>技术监督委员会在整个基金会的决策当中是非常至关重要的一个环节。刚才我们提到基金会最大的职能之一是托管项目、孵化项目,帮助项目走向成熟。所以衡量一个基金会的好坏,就是看它当中的项目是否有价值,是否能成功。</p><p>当然这是比较务实的看法,比如说我们认为 Apache 基金会和 Linux 基金会是成功的基金会,正是因为它们下面孕育大量的成功项目。</p><p>但成功未必一定是指商业化的成功,但是至少让项目拥有广大的用户群,对用户产生价值,这个评判标准是统一的。哪怕项目不能被很好的商业化,但能被大量的开发者接受和使用,那么它也是一个非常成功的开源项目。</p><p>在这个基础上,TOC 最大的职能就是帮助并监督捐赠出来的项目在社区治理方面搭建一个好的框架、制定一套原则,让每个项目去顺着合理合规的开发流程和沟通流程往下发展。这是我们对于“毕业”的评判标准。</p><p>其次,我们并不会过分关注商业化的成功,而是关注项目是否从企业自身维护的状态转变为社区维护的形式,不再被捐赠企业的商业计划所影响。这是一种对用户负责的方式,如果项目因为一家企业的商业变化发生重大影响或者无人维护,对于用户的损失是最大的。</p><p>所以,我们制订了宽进严出的规则。对于希望加入基金会的项目,我们都表示欢迎,不会设置过多的门槛。但在“毕业”这个事情上,我们会要求比较高,规避上述提到的各种风险。</p><p><strong>Q5:您刚才提到了开源项目的“毕业机制”,除了社区化运行这一标准外,还有哪些其他的考量维度?</strong></p><p>对于“毕业机制”,我们制定了一套“标准”。比如代码本身应该遵从一定的代码标准规范和审查合入流程。</p><p>代码质量和代码规范因项目而异,是由社区自己制定的,但一定要有一套规范并且遵从规范。比如要有一套严格的 commit 机制,保证代码是被 review 之后再合并进去。</p><p>此外就是我们前面提到的社区化运行标准,除了社区共享共建外,还需要将信息用公开透明的方式进行社区化的技术决策。</p><p>所以我们的毕业机制即包含代码级别的考量,也涉及到人、组织结构、社区机制等维度的综合评定。</p><p><strong>Q6:在具体的项目当中,TOC 参与的程度会是多少?</strong></p><p>我们在 TOC 制度下还设置了一个项目导师的角色,在项目的具体运行中采取的是 TOC 和导师联动的机制。导师是公开向全社会开放征集的,我们首批已经征集了 20 名导师。</p><p>导师团体会跟项目之间通过双向选择来绑定挂钩,每个项目大概会有 3-5 名导师来进行辅导,参与到项目的运营当中,并给出项目开发以及社区化流程等方面建议。目前导师的构成有很多是成熟开源项目的发起者和各大基金会中长期的代码贡献者,他们都有着丰富的开源社区开发的经验。</p><p>通过这样的角色分工,TOC 可以进行开源领域顶层的技术规范的治理,导师则针对具体的项目进行可落地的协助。当然,TOC 也会在项目有需求的时候直接介入到项目当中去,我本人也会以志愿者的身份加入TOC 的导师团队,借助自身的经验发挥更多的职能。</p><p><strong>Q7:前不久成立的 OpenHarmony 项目组,目前有没有一些具体的发展计划?</strong></p><p>对于 Open Harmony 这种大伞型的项目,我们希望能够让工作组的人去制定相应的具体策略。比如这个项目要不要从「端」走到其他领域?这些具体的技术演进方向,希望还是由工作组的技术委员会成员共同商量决定。TOC 只负责监督项目是不是向着满足孵化毕业标准的方向发展。</p><p>此外,因为这个项目具备一定的成熟度,后续我们会更多的关注项目实际的运行情况,包括社区化运行标准的建立等,看看项目对于社区、对于开发者具体能提供怎样的价值,有多少活跃的开发者和贡献者,这些也将作为能否毕业的标准。</p><p>但对于项目未来具体进入什么领域,或者在各个产业领域方向是什么,我们还是希望工作组发挥自身的价值。TOC 不可能涵盖所有领域的专家,也自然不可能在所有项目中都给出专业领域的建议。比如 openHarmony 这类端侧的大规模操作系统,需要产业专家、技术专家、执行专家、运营专家等等的介入,共同构成一个决策机构,来推动项目走向真正的落地成功。</p><p><strong>Q8:我们看到基金会中有一些项目存在业务层面的交集,在基金会中会存在一种内部的竞争关系么?</strong></p><p>开源的世界是鼓励竞争的,只有竞争才会让开发者有更多的选择。鼓励竞争,是我们一个基本的原则。</p><p>比如说我们有一个做好的轮子,那么欢迎大家来加入,让轮子变得更好;但如果有一些人或者团队觉得这个轮子不够好,再去重新发明一个轮子也OK。</p><p>第二,在竞争的基础上我们希望推动合作。如果两个项目“apple to apple”来相比并没有太多的差异点,我们是鼓励以某种方式去合作融合,从而实现 1+1 大于 2 的效果。</p><p>我们不希望基金会的项目被一个公司所垄断,在开源的世界里,垄断就意味着封闭和落后。我们希望有多元化的声音、多元化分布式的决策机制。这个决策机制建立起来之后,才能让有竞争关系的厂商更好的融合。</p><p><strong>Q9:您觉得未来技术发展会是每个垂直领域有一个头部企业,还是将出现一个大系统生态覆盖整个行业?</strong> </p><p>我觉得出现大系统生态的可能性会大一些。</p><p>如果把开源的整个技术栈打开,会发现它是非常丰富的。我之前做了大概 10 年的大数据,我能看到除了资源调度系统和底层的 HDFS 没怎么变,上层的执行引擎框架、SQL 引擎不断的在变化。大公司、小公司、新创立的公司在不断加入开源当中,我觉得这就是一个生态。</p><p>我们可以把开源想象成一片亚马逊的原始森林。亚马逊的原始森林发展的这么好,正是因为它蓬勃、有生机,其实开源也是这样。</p><p>开源当中需要大树需要河流,也需要各种各样的小树、蘑菇、菌落等等,它们共同存在,形成一种共生关系。我认为开源的好处就是大家可以在一种野蛮生长、充满各种可能的环境当中。如果硬要将开源行业打造成一篇皇家园林,这种生机可能也就失去了。</p><p>当然,我非常希望国内有更多的企业能成长为丛林中的参天大树,凭借他们更充足的资源、技术储备和人才储备来共建开源。而从开放原子开源基金会的角度,我们也会格外注重 start-up 公司的创新创造,为他们提供扶持。</p><p>只有这样生态才能更为完整、更为健康,让所有人从中受益。</p><p><strong>Q10:您觉得一些企业不愿意投入更多精力开源,除了商业化的考量还有哪些其他因素?</strong></p><p>可能与这些企业早期的领导层有关。</p><p>国内很多互联网公司是基于 LAMP(Linux, Apache等)这些免费的开源项目发展起来的,但他们并没有开源意识。首先是没有通过开源来主动回馈社区,其次就是没有真正意识到开源的价值,在企业做大之后没有重新去思索成功的秘诀。</p><p>我觉得全球高科技行业,都是带着开源的红利成长的。欧美在这方面的意识可能觉醒的早一点,而在国内仍需要不断的去发掘、去思索。这也是开放原子开源基金会和 SegmentFault 思否不断布道开源精神、探讨商业开源价值的实际意义。</p><p><strong>Q11:下一个阶段开放原子基金会主要想找的项目方向有什么规划吗?比如哪个领域的开源项目是主要关注的?</strong></p><p>从基金会现在的项目里可以发现,IoT OS 是涉及较多的领域。关于项目版图未来的规划,我们从整个 TOC 的角度有过讨论。</p><p>首先我们希望可以看到已有的基金会各有各的特点,比如 Apache 基金会的灵魂是在大数据领域,大部分开源的大数据项目和中间件项目都托管在 Apache 基金会。Linux 基金会则比较偏重底层一点,CNCF面向云原生和容器,LF AI 基金会则是专注 AI 领域。我们预期中的开放原子开源基金会是面向全领域的,是非常开放的。</p><p>与此同时,我们也会更多关注业界的热点领域,比如目前项目较多的 IoT OS。在全球的基金会版图当中,现在并没有哪个基金会专注于这个领域,所以这部分的项目我们会重点观察。另外开源项目在未来发展可能会比较快的一些领域,比如 AI、AR/VR等等,我们也会继续关注。</p><p>但下一步的整体规划,还是要结合实际捐献企业的实际情况,包括产业力量的对比。这里可以透露一个消息,开放原子开源基金会有计划立足中国面向全球来梳理热点开源项目的地图。识别出来之后,我们会去看哪些项目有快速增长的潜力,也会主动去吸引一些有潜力的项目进来。这样可以以基金会和 TOC 的专业运作来帮助项目更好的成长。</p><hr><p>在采访的最后,堵俊平和记者分享了 TOC 短期与长期的目标。短期目标将会继续关注项目孵化与高潜力项目的挖掘。而从 TOC 的人员构成来看,很多都是开源领域的“老炮儿”,背负着传播开源理念、传承开源文化的责任,这也会是 TOC 长期的目标之一。</p><p>开源正在改变世界,开源软件、开源硬件、开源内容在各行各业有着越来越重要的地位,开源的模式在改变各个行业的生产方式并大大提高了生产效率,但开源的发展仍需各界人士的积极参与。</p><p>开放原子开源基金会的使命是“一切为了开发者,一切为了全世界”。随着发展,开放原子开源基金会已经展现出了能力与价值。以「开源」为纽带的开放原子开源基金会 2020 年度峰会,正是希望通过会议的形式,号召开源各界人士一起推动中国的开源事业,基金会愿意持续构建一个开源的生态,帮助大家共建、共治、共享。</p><p><img src="https://image-static.segmentfault.com/103/361/1033613980-600e2e4b429f5" alt="segmentfault思否" title="segmentfault思否"></p>个推CTO叶新江:数据智能的未来,是不提大数据但其无所不在的时代丨思否专访https://segmentfault.com/a/11900000386470942020-12-25T10:04:10+08:002020-12-25T10:04:10+08:00思否编辑部https://segmentfault.com/u/writers10<p><img src="/img/bVcMjZT" alt="clipboard.png" title="clipboard.png"></p><p>回首过去十年,我们见证了大数据从概念诞生到行业落地,逐渐发展到基于数据中台驱动决策的数据智能时代。作为后互联网时代的产物,数据智能必将是未来很长一个发展阶段的核心所在。</p><p>每日互动(个推)作为数据智能行业的代表企业之一,于今年迎来了第一个十年。在这十年间,个推以消息推送起家,借助技术力量拓宽以数据智能为核心的业务范畴,现已成长为一家在A股上市的数据智能企业。</p><p>但“数据智能”这个词,对于大众来说仍然相对比较陌生。数据行业资深从业者如何定义“数据智能”?过去的十年间,个推经历了怎么样的发展历程?即将到来的“数据智能”新十年,个推又将以什么样的角色参与当中?</p><p>在个推十周年之际, SegmentFault 思否带着以上这些问题,对个推 CTO 叶新江进行了一次专访。</p><p><img src="/img/bVcMj0a" alt="clipboard.png" title="clipboard.png"></p><h2>01、何谓“数据智能”?</h2><p>随着移动互联网时代的到来,互联网内容传播和展现形式发生了巨大的变化,也让数据的量级和形态发生了改变,数据服务也随之发生了转变。传统的数据服务基本只针对于数据本身,而数据智能作为一种由数据、算力和算法等驱动的技术手段,具备着赋能企业进行管理和决策的能力。</p><h4><strong>Q1:数据智能是今年非常热门的一个话题,能否谈谈对于「数据智能」和「数据中台」的定义与理解?</strong></h4><p>目前数据经济在国家层面是一个非常重要的发展方向,但同时也延伸出了一个亟待解决的问题 —— 如何把各个行业的数据作为生产要素,通过数据治理发挥出更进一步的作用。</p><p>针对看不见摸不着的数据,需要有一个东西能进行有感管理,数据中台就是一种用来进行数据治理的产品或者平台,而数据智能则属于一个更为广义的范畴,它是以数据作为生产资料,通过结合大规模数据处理、数据挖掘、机器学习、人机交互、可视化、云计算等多种技术,从大量的数据中提炼、发掘、获取知识,为人们在制定决策时提供有效的支持,减少或者消除不确定性的解决方案。</p><p>这两个词看起来很接近,但其实是不同维度的。以我们公司来讲,数据中台更多的是一个产品,体现了我们公司的数据能力;而数据智能则包含更多技术,融合了更多的行业知识,中台是其中一个很重要的工具。打一个形象的比喻,数据中台或者平台是一个电脑的操作系统,而数据智能则是结合业务,使用这个电脑,利用多种技术进行APP开发,并且不断进行优化的过程。</p><h4>Q2:您认为数据中台的「行业壁垒」和「技术壁垒」分别是什么?个推作为一个成功上市的专业数据智能服务公司,自身在这个领域内具备的最大优势是什么?</h4><p>目前市面上有很多数据中台类的产品,据我们观察,其中大部分的重点仍主要聚焦于数据治理的能力,但这可能只是数据中台的“第一步”。</p><p>对于数据中台产品来讲,技术壁垒可能并不是很高。中台会应用到的技术,虽然有些功能可以通过直接使用开源产品来实现,但也有不少标准或者要求,比如安全性、实时性、可视化能力等,需要专业的技术来定制实现。</p><p>当然在数据中台层面,采用的技术架构不同、产品设计的理念不同也是可以有差异的,譬如是否容易使用、容易理解、对资源要求是否经济等。</p><p>如果希望通过数据中台中来解决业务问题,实现降本增效或者发现新的业务模式,这就不是数据治理能解决的问题,需要有对行业的深度理解,也就是所谓的行业壁垒。</p><p>个推和其他大数据公司的差别,就体现在如何挖掘数据价值的层面。</p><p>个推的第一款产品是消息推送服务,这是一项跟数据紧密相关的业务。为了支撑这项业务的进行,实现消息推送在海量数据量下的快速响应,个推一直在尝试为企业内部打造一个业务 + 数据平台的协同闭环。这也为之后公司推出数据服务产品打下了很好的基础。</p><p><img src="/img/bVcMj0H" alt="clipboard.png" title="clipboard.png"></p><p>在数据服务层面,个推既是服务的提供者也是使用者,这是我们在这个领域内最大的优势。</p><h4>Q3:数据服务领域是否有一套标准化的判定体系?如何评定服务能力与技术水平的高低?</h4><p>数据服务领域暂时还没有一套国际或者国家权威机构提出的行业标准。究其原因,是因为数据服务在不同的行业间有着很大的差别,与一般的技术体系相比,具备更强的服务属性。</p><p>对于客户来说,挑选数据服务的时候会有几个考量的维度:</p><ul><li>平台是否可以快速部署;</li><li>部署所耗费的资源是否合理;</li><li>能否借助数据服务快速实现业务提升;譬如是否能快速开发出业务的新需求,是否能很好地完成内部各个角色之间的协同。</li></ul><p>这三项标准会是客户选择服务时的决策依据。但在选择完之后,服务商应该如何完成、如何实现客户提出的需求,因为没有清晰的界定与评判方式,需要客户在选型时进行综合性的考虑,并在后续实际的业务场景中去感受平台的服务能力。</p><p>这种情况其实也和市场需求有关。目前国内企业提出的需求都较为“定制化”,再加上不同行业间的差异,导致国内的数据服务公司大部分是结合行业提供垂直的数据服务能力。</p><h2>02、个推发展的每一步,踩的都是行业需求</h2><p>我国的数字经济发展才刚刚开始,数据智能服务的能力也在不断迭代、发展。人工智能、区块链、知识图谱、可视化等新兴技术,都可以作为底层的技术支撑为数据智能服务赋能,从而让我们的数据服务具备更强大的能力,产生更多价值。</p><h4>Q1:个推的发展经历了多个阶段,技术也在不断迭代和演进。能否简要分享一下不同阶段的业务逻辑重点以及技术研发重点?</h4><p>个推是我们的消息推送产品,做得比较早并且比较成熟了。但其实我们公司发展到现在已经十年了,业务范畴也早就不止是消息推送了。</p><p>公司发展的第一个阶段是 2010 年到 2013年。当时我们的核心团队主要是在打磨消息推送的能力,也就是一套大规模的通信系统 + 互联网搜索系统,这是一个比较垂直但对于技术要求很高的领域。</p><p>2014年至2018年,公司进入了数据价值的“掘金”与“实践”阶段。在不断精进推送能力的同时,我们发现系统产生了非常多的数据,如何让这些数据发挥价值成为了我们需要思考和解决的问题。也是从这个阶段开始,个推开始致力于大数据系统的研发。</p><p>个推的消息推送产品每天会产生几十个 T 的数据,如何存储、清洗、建模,如何在业务场景中产生商业化的价值,这是这一阶段我们的研发重点。经过几年的业务培养与场景实践,我们将在数据服务领域沉淀下来的能力和 know how(知识、经验、流程) ,变成一种可以服务于更多行业的产品,可以说公司正式进入到了数据智能的阶段。</p><p>2019年3月,每日互动成功在A股创业板上市,也引起了数据智能领域的一次新风潮。</p><p><img src="/img/bVcMj1u" alt="clipboard.png" title="clipboard.png"></p><p>在今年的疫情过程中,个推数据智能的能力得到了相当程度的验证。疫情期间,我们与李兰娟院士取得联系,与李兰娟院士团队合作成立联合战队。通过大数据技术,联合战队对疫情发展态势进行了研判,帮助疫情防控部门找到工作重点区域、重点人群和重点场景。在全国逐步有序恢复生产的时候,个推也充分发挥大数据能力并参与其中,为多个省份的疫情联防联控与民生保障、复工复产的有序统筹提供了决策参考依据。</p><p>当然,个推的数据智能服务仍然是在不断迭代发展的。随着人工智能、区块链、知识图谱、可视化等等新兴技术的发展,这项基于数据的服务也将产生更多的价值。</p><h4>Q2:个推致力于打造“每日治数平台”,目标方向是什么样的?与一般的中台产品有什么区别?</h4><p>「每日治数平台」其实也是数据中台的概念,但我们提供的数据服务主要是应用于数据治理领域,所以命名为治数平台更为准确。</p><p>这个平台还有一个提炼后的名字 —— DMP。D 代表了数据(DATA),M 代表了 机器(MACHINE),而 P 则代表了人(PEOPLE)和专业(PRO)。这几个关键词也代表了我们平台的定位,即数据作为底层资料,快速专业地服务于具体业务当中。</p><p>我国的数字经济发展其实才刚刚开始,据了解,不少企业并不知道该如何进行数字化、智能化的转型,业内也缺乏专业的数据人才。</p><p>因此,我们的目标方向和传统的数据中台不同。我们希望真正将个推 know how 的能力沉淀下来,形成客户可以复用的服务或平台产品。之所以想要打造这样的一个平台,背后其实也是基于用户的实际需求。</p><h4>Q3:个推的第一个客户是哪家企业?</h4><p>个推消息推送业务的第一个客户是新浪微博。当时微博非常火,有着上亿的用户量,消息推送对他们来说是不可或缺的一项功能。</p><p>2011年,我们主动联系了微博相关业务的负责人,表示可以提供专业的消息推送服务,用更低的成本来实现更好的效果,这也是我们能够打动他们的原因。</p><p>之所以第一个客户就敢挑战“行业顶配”的难度,一方面是技术团队自身具备扎实的技术基础和行业基础,另一方面就是前面提到的,我们在支持自身业务的过程当中沉淀下来的数据和技术能力。</p><p>有这样一个需求明确的大客户,让我们的技术服务能力得以更加高效地迭代,大大加快了技术进步的速度。</p><p>接受挑战并做到“极致”,正是我们公司的工程师文化,对此我们感觉很自豪。</p><h4>Q4:目前面向的客户群体有哪些,涉及哪些领域?</h4><p>随着数据能力的增强,以及对于行业理解的不断加深,我们目前的服务客户已经扩展到四大领域 —— 互联网、公共服务、风控服务和品牌营销服务。</p><p>以金融领域为例, 很多金融机构内部有自己的 App,涉及推送、统计、分析之类非常繁复的数据和信息处理场景。我们帮他们打造了一个集成的消息平台中心,解决了消息处理的分散问题,改善了工作流程。在深度沟通之后,我们发现数据智能服务在金融行业中是一个非常重度的业务场景,为此我们也在考虑开发专门针对金融行业的治数平台。</p><h4>Q5:对于数据公司来说,数据安全是红线。个推如何保障数据安全性?</h4><p>个推团队自建立之初,便非常注重对于数据安全的保障。正如问题所说,数据安全对数据公司来说是红线,个推始终认为保护用户数据隐私是企业必须要坚守和捍卫的行业准则、道德底线,并要时刻保持对数据安全的敬畏之心。</p><p>个推在严格落实合规和监管要求的同时,倡导行业自律,积极联合行业伙伴的力量,共同推动行业的健康发展。今年8月,由个推牵头起草的《信息安全技术移动互联网应用程序(App)SDK安全指南》国家标准项目,获得全国信息安全标准化技术委员会正式立项,这将有助于SDK行业在开发、运营、信息处理、安全管理等环节向更规范的方向迈进。</p><p>在今年的浙江省网络攻防演练当中,个推在395家参选企业中不借助外部安全公司的力量,仅凭公司自身的安全能力,便取得了第 14 名的成绩,还是很自豪的。</p><h2>03、大数据的未来,是不提大数据但是数据又无处不在的时代,“你意识不到我的存在就是我最大的存在”</h2><p>随着数据产业的规模越来越大,生态分工在未来将会越来越细,数据服务也将越来越细。而随着人工智能、云计算、物联网等技术的发展,大数据会不会和互联网一样,不再成为人们单独讨论的概念,而是成为像水电一样的基础设施,服务于各行各业中?</p><h4>Q1:随着社会的发展,未来的数据会呈现多形态共存的状态。您认为未来几年大数据领域会出现什么样的一些变化?哪些因素将推动这些变化?你们的生态布局是怎么样的?</h4><p>随着 5G 的成熟,数据领域的发展将从基础的量变迎来一次质变,成为像水电一样的社会基础设施。</p><p>近几年大家其实很少再单独讨论互联网的概念,其中的一个因素,我认为是互联网已经不再是新鲜事物,现阶段技术的发展基于互联网但又高于互联网,大数据之后的发展肯定也会这样,数据智能的未来,虽然基于大数据,但是不会再单独讨论大数据的概念。</p><p>从技术层面来看,大数据行业的发展对海量数据的存储、处理、挖掘需求肯定会越来越高,未来可能也会诞生出几个巨头,将行业进行更加明确的细分。这是一个大家已经能够观察到的趋势。</p><p>随着数据产业的规模越来越大,生态分工在未来将会越来越明确,数据类的服务也将越来越精细化。我们打造的个推每日治数平台,就是希望能够参与到生态的建设当中,甚至围绕平台打造出一种新的生态。</p><h4>Q2:业内最近有个观点:“云原生体系架构是云服务时代的数据管理方法论”,从技术角度来看,您如何评判云与数据智能间的关系?</h4><p>不同的人评价同一件事肯定会有不同的出发点,这个观点看起来应该是云服务厂商提出的(笑)。很巧,我前一阵也跟吉利公司的人在讨论这个问题,他们最近刚从一家云厂商中迁移出来。</p><p>对企业来说,上不上云、选择公有云还是私有云、选择哪家云厂商需要考虑几个维度:成本吃不吃得消、是否自主可控、当不满足业务需求或者服务需求时是否方便切换等。</p><p>以个推为例,我们目前不会将数据放到第三方的云上,但从资源的调度、成本的控制等方面来看,云体系已经是一个公认的标准答案,所以我们也会使用云计算的相关技术,比如容器云、虚拟化等。</p><h4>Q3:物联网、AI、机器学习等新技术的出现,对行业来说是机会还是挑战?个推应对技术的发展是否有做哪些前瞻性的探索?</h4><p>新技术的出现,对行业来讲既是机会也是挑战。每次新技术的出现,都能为人类解放生产力或者提高生产力提供了可能性。</p><p>但一些技术因为过于“新”,暂时还没有找到发挥能力的场景,没办法发挥出实际的社会价值,让企业的投入与产出不成正比。</p><p>个推还成立了数据智能研究院,目前研究的方向是探索如何将技术更好地服务于具体的业务当中。比如我们对物联网技术方向的探索,是想将自身的推送技术能力延伸到电视机、汽车等场景当中;对机器学习和区块链的探索则是为了进行一些业务模式的研究。</p><p>技术是面向未来的,但用户的需求是现在的。对于我们来说,目前的重点还是如何借助技术快速迭代服务能力,为用户以及行业赋能。</p><hr><p>回顾大数据行业和个推的发展时间线,不难发现个推成立的这十年,恰巧也是大数据从一种辅助工具向引领发展方向的核心引擎转变的十年。</p><p>随着大数据行业的发展,国家正在大力发展数字经济,企业正在迎来一波借助数据智能实现数字化、智能化的转型新浪潮。在这股浪潮中,开始“治数”的个推将会扮演一个什么样的角色?我们拭目以待。</p><h2>限时福利:</h2><p>个推十周年之际,SegmentFault 思否联合个推一起为广大开发者准备了重磅福利 —— 爆款SDK免费用1年、热门大数据产品0门槛试用!点击<a href="https://link.segmentfault.com/?enc=y9vFDfYAMEoVLoMyzdsjyA%3D%3D.AifXksFk0CJLq4xM5E2gSLXyVqLDWMusGUk%2FuQZD9ygTOmgnaDRH7d1G2hJsDUJwJKGhiabb6aefhew%2FhTNm7KKnnb2adk2oq1VRHxNzlGZSGMzEf%2BePGmd9M%2FYJpy31t4US3D0VhZ5%2BWbryawHmsncN1wz4hH6AvhEw%2FaTmsq3lOPH8kC3tmLaHedG7olyFESoFnD8TecXYyN4IQff2wW1rUXOJjPfRxsnhFElSb1HNp00gs3dOZeoXaApRZh3b" rel="nofollow">「领取链接」</a>,即可参与,还有丰富的惊喜礼盒限时领取!</p><p><img src="/img/bVbOFol" alt="segmentfault 思否" title="segmentfault 思否"></p>实现跨设备智慧办公,WPS 携手 HarmonyOS 一起打造智慧办公超级终端https://segmentfault.com/a/11900000384232582020-12-09T11:25:30+08:002020-12-09T11:25:30+08:00思否编辑部https://segmentfault.com/u/writers11<p><img src="/img/bVcLnMM" alt="harmony" title="harmony"></p><p>在 2020 年 9 月 10 日的华为开发者大会上,华为重磅推出了 HarmonyOS 2.0 版本,为全场景智慧生态的演进提供了大量的开发工具和平台优化开发体验。在办公场景,WPS 就是首批加入 HarmonyOS 生态的代表,搭载 HarmonyOS 2.0 后,WPS 新增了办公协同能力,跨设备协作体验得到了极大提升。</p><p>有着 30 多年发展历史的 WPS 为什么会选择率先加入 HarmonyOS 生态?接入 HarmonyOS 为 WPS 解决了哪些用户痛点?HarmonyOS 对整个智慧办公领域会带来哪些新的机遇?金山软件高级副总裁庄湧在近日接受采访时,从技术价值与商业价值的角度分享了这次合作背后的故事。</p><hr><p><a href="https://www.bilibili.com/video/BV1pA41147JF/?aid=330555773&cid=264543353&page=1">https://www.bilibili.com/vide...</a></p><h2>全场景智慧时代来临,WPS 牵手HarmonyOS 打破数据跨设备流转屏障</h2><p>庄湧谈到,WPS 之所以选择加入 HarmonyOS 生态,是发现 HarmonyOS 的分布式能力和对现在办公场景中用户痛点的解决有极大的帮助。进入移动时代后,办公软件的使用场景开始从过去 PC 端,扩大到智能手机、PAD 等更多的移动端,多台设备之间基于文档的流转成为了办公软件场景中最重要的痛点之一。</p><p>HarmonyOS 分布式能力给移动办公场景带来了跨设备无缝流转的全新体验,WPS 在搭载 HarmonyOS 之后可以让文档在数据跨设备浏览时,打破了数据流转的屏障,带来更便捷、高效、安全的分布式数据管理能力。</p><h2>提升用户体验,HarmonyOS 助力 WPS 更好的服务用户</h2><p>在采访中庄湧表示,WPS 始终以用户为中心,此次和 HarmonyOS 的合作带来了用户体验和产品能力的全面提升,从这个方面来讲能够帮助 WPS 更好的服务用户。</p><p>随着全新的用户需求场景的到来,用户对办公软件的诉求已经从单纯的一台设备操作升级到跨设备以及多人之间的协作协同,要求办公软件具有更好的跨设备协同的能力,而 HarmonyOS 的分布式软总线、分布式数据管理和分布式安全三大核心能力正好可以解决这个问题。基于 HarmonyOS 整个分布式架构之上,用户只需打开 WPS 应用就能通过轻松一扫,将手机上的文档同步到大屏上,同时支持实时批注和文件的分享,整个流程非常自然顺畅。</p><p>其次,WPS 也接入了 HarmonyOS 中关于安全方面的 SDK,对安全体系进行了深入的改进。庄湧提到,WPS 本身已经在基于账号的体系做了针对 office 文档更进一步的智能安全保护,但借助 HarmonyOS 分布式安全的能力,WPS 能够更简单地去设定、拷贝、打印、分享文档的权限,进而更进一步提升了安全性。</p><p>庄湧坦言,商业的成功首先都是寄托于产品帮助用户解决什么样的问题。HarmonyOS 的出现解决了办公场景跨设备间流转与分享的痛点,自然而然对应的商业价值体系就会体现出来。因此在基于跨设备多人协同的新用户场景到来的时候,WPS 选择借助 HarmonyOS 在跨设备的技术优势,更进一步的强化与完善产品能力,逐步探索出全新的用户服务点。</p><h2>万物互联时代 HarmonyOS 助力智慧办公创新升级</h2><p>万物互联时代,智慧办公的难点在于海量数据的分享和运用,实现智慧办公需要解决企业如何首先在内部形成适用于自身的办公体系问题,同时,在提升工作效率的基础上确保数据的安全。</p><p>HarmonyOS 为解决智慧办公的难点与痛点提供了基础能力,围绕智慧办公场景做到了进一步的强化与完善。WPS 基于用户体验的功能提升也证明了 HarmonyOS 分布式能力在智慧办公场景的可用性以及实用性。</p><p>HarmonyOS 降低了产品和应用创新的开发门槛,同时为更多技术和人才的合作以及推动生态领域的前进提供了支撑。正如庄湧所说:“进入到万物互联的时代,HarmonyOS 让我们重新思考设备与设备之间的联系,重新审视人与设备的交互方式,也让我们重新认识应用在多设备之间的调用方式。所以我们也认为,以人为中心,回归到用户需求的本源,智慧办公理应如此。”</p><p><img src="/img/bVbOFol" alt="segmentfault 思否" title="segmentfault 思否"></p>老板电器携手华为HarmonyOS,推动厨电智能化产业升级https://segmentfault.com/a/11900000383315762020-11-30T17:08:15+08:002020-11-30T17:08:15+08:00思否编辑部https://segmentfault.com/u/writers10<p><img src="/img/bVcKZVH" alt="华为HarmonyOS x 老板电器" title="华为HarmonyOS x 老板电器"></p><p>“民以食为天”,中国烹饪文化由来已久。中式烹饪不仅技法多、步骤繁琐,烹饪过程还充满不确定性。随着 5G、物联网时代的到来,技术的创新不断地在为这项传统文化注入新的活力,使得烹饪方式也发生了很大的变革,如何优化烹饪者和厨电产品之间的互动,提升烹饪体验和成功率,成为新时代厨电创新者亟需解决的难题。</p><p>今年华为 HDC 开发者大会上,一款搭载了 HarmonyOS 2.0 的老板大吸力油烟机在体验区亮相,这是老板电器与 HarmonyOS 合作推出的首款创新产品,其创造性的“碰一碰”实现快速的配网,并且不需要安装 App,通过手机端能够去实现油烟机的基本操作功能:开关机、调节风量以及可以实时检测到有网的污浊程度来做有网的清晰的提醒,引发了大众广泛关注。</p><p>那么作为华为 HarmonyOS 的首批合作厂商之一,老板电器为何选择了加入华为 HarmonyOS 生态伙伴圈?这款产品会为传统的厨电用品业、传统的中式烹饪文化带来哪些想象的延展?围绕这些问题,记者于日前采访了老板电器 CMO 叶丹芃、老板电器智能化总监朱世民,逐步揭开了本次合作背后的故事。</p><p><a href="https://www.bilibili.com/video/BV1av411t7Ug/?aid=245388735&cid=261380415&page=1">https://www.bilibili.com/vide...</a></p><h2>推动厨电智能化升级,老板与 HarmonyOS 理念高度契合</h2><p>传统厨电业在中国经历了多年的发展,而 5G 和 IoT 技术的普及又为这一领域带来了新的契机和支点。</p><p>老板电器 CMO 叶丹芃提到:“近年来我们可以看到厨电业从单机智能迈向场景化智能,未来最终要实现的是万物互联,这是大势所趋,也是行业共识,老板电器对此也有着清晰的认知和定位。一方面,我们积极拥抱成熟的 IoT 大平台,或者是与相关方建立战略同盟关系,从而推进智能化,另一方面,我们扎根于厨房场景,在自身最为专业垂直的领域做深做透,挖掘其背后更大的价值空间。”</p><p>正是在这一认知的驱动下,老板电器一直致力于将智能化成果应用到厨房整体解决方案上,同时这一努力也最终促成了与华为 HarmonyOS 的合作。</p><p>老板电器智能化总监朱世民表示,HarmonyOS 把众多物联网的基础能力集成在一起,当前各家电厂家采用各自的通信协议、各自的标准,导致各品牌家电不能互联互通,信息成为孤岛。而 HarmonyOS 的开放性会成为行业发展的一个趋势和方向,它有可能会成为一个技术标准,从这个角度来讲,非常有利于解决 IoT 行业的碎片化问题。</p><p>由于在理念和发展方向的高度契合,双方最终达成合作,共同推动厨具家电的智能化升级,而华为开发者大会上亮相的搭载 HarmonyOS 的老板大吸力油烟机就是双方通力合作的产物。</p><h2>大幅提升烹饪效率,老板与 HarmonyOS 的创新尝试</h2><p>在华为开发者大会上第一次登场的老板吸油烟机 5915ST 虽然尚未量产入市,但在发布当日就引起了大众热议和媒体聚焦。这款搭载了 HarmonyOS 的高端吸油烟机,通过用华为手机碰一碰,就能实现快速无感配网。</p><p>可以说,老板吸油烟机 5915ST 搭载 HarmonyOS,不仅是优势资源之间一次创造性的融合尝试,更是新厨房与先锋科技之间的一次智慧碰撞。</p><p>叶丹芃表示,中式烹饪有多达 72 种烹饪方式,每一种烹饪都有着非常大的挑战。老板电器本身智能化的目的就是要化繁为简,让新生代能更便捷地去享受烹饪乐趣,提升烹饪效率,而与 HarmonyOS 的合作能够在某种程度上解决这个问题。</p><p>当下智能家居设备比较普遍的问题是入网率低,平均App安装率低,导致割裂整个生态系统的联动。而老板吸油烟机 5915ST 首先解决了“连不上”的痛点:只需通过华为手机碰一碰就能实现快速的配网,从而实现油烟机的基本操作功能:包括了开关机、调节风量以及可以实时的去检测到油网的污浊程度来做油网的清洗提醒,并且还能够开启远程的模式,即便你是在外度假,也可以定期对厨房的环境做一次空气的检查和管理,让烹饪更安心。</p><p>朱世民提到:“App 是一个比较重的应用,用户需要经过下载、登陆一系列操作才可以去连接设备,实际对于用户是不太友好的。我们采用了 HarmonyOS 的全新技术,就可以通过‘碰一下’这个动作实现对于烟机的操作,免去繁琐的配网和下载安装 App 的步骤,对用户来说非常便捷,大幅提升了烹饪效率。”</p><p>与其他开发平台相比,朱世民认为,华为 HarmonyOS 的优势主要集中在分布式技术和开放性上。“HarmonyOS 是面向全场景多终端的操作系统,其分布式软总线技术使得不同设备之间可以高效地进行数据传输。而且这是一个开放性的平台,由它发展起来的生态圈将有助于各种开发协议的标准化、体系化,成为推动我国物联网技术发展的一大助力,加速万物互联世界的构建。”</p><h2>持续深入合作 合力打造全链路厨房场景生态</h2><p>厨房对用户而言也不仅仅是“做饭”这样单一的功能需求,如何更好地满足用户在整个烹饪过程中全链路的厨房场景体验是一项挑战,需要通过设备和技术创新去进一步赋能和提升。朱世民提到,老板电器是HarmonyOS在厨电领域的第一个应用先行者,“吃螃蟹者”当然会碰到很多挑战,尤其在软件调试和软硬件联调方面,对此华为提供了全方面的技术支持。</p><p>目前老板电器与华为 HarmonyOS 的合作只迈开了第一步,叶丹芃介绍,双方的战略合作将围绕三个方面继续推进。其一,延伸到更多品类;其二,开发更多应用场景;其三,探索更多深层次的合作模式;将烹饪前、烹饪中、烹饪后等烹饪全链路进行打通。</p><p>“首先,当下我们通力合作的只有一款吸油烟机,接下来与 HarmonyOS 的合作会逐步延伸到厨房内的其他厨具产品,包括灶具、蒸烤一体机、洗碗机等等。</p><p>进而在不同产品上实现更多的场景应用,比如基于 HarmonyOS 打造的灶具实现手机端远程关火、防干烧预警等更安全的应用;在蒸烤一体机上实现碰一碰手机端菜谱功能,采用烹饪曲线的组合应用,实时操控温度时间;在洗碗机上运用以餐具浊度情况为依据的自动清洗曲线,让整个烹饪流程一步到位。</p><p>此外,我们还可以发挥想象,和华为更多的 HarmonyOS 智能设备进行打通形成一个场景化超级虚拟终端。比如通过共享华为智能手环中的运动、睡眠等方面的健康数据,为每个用户推送更加个性化的菜谱,从而提供更加合理的膳食营养解决方案。”</p><p>未来,随着老板电器与 HarmonyOS 的合作逐步深入,双方将朝着推动厨具智能化产业升级的方向继续前行。技术创新无止境,对于美好生活的想象也无边界,正如叶丹芃所说,“我们希望未来有越来越多的合作伙伴和我一起参与到 HarmonyOS 超级终端的创造过程中,共同为用户服务,实现资源的互补,实现数据的互联互通,真正的集智慧于大成,一起携手去创造更多更新的价值。”</p><p><img src="/img/bVbMd4g" alt="segmentfault 思否" title="segmentfault 思否"></p>美的与 HarmonyOS 强强联合,共同布局万物互联时代https://segmentfault.com/a/11900000382604142020-11-23T18:06:40+08:002020-11-23T18:06:40+08:00思否编辑部https://segmentfault.com/u/writers12<p>2020年9月10日,在华为开发者大会 2020 现场,华为常务董事、消费者业务 CEO 余承东正式发布 HarmonyOS 2.0 版本,并公布了国内首批率先加入 HarmonyOS 生态的重要合作伙伴名单,美的集团榜上有名。</p><p>作为国内 HarmonyOS 生态先行者,美的集团在今年双 11 隆重推出十多款搭载 HarmonyOS 系统的家电产品,包括净水器、热水器、洗碗机、蒸烤料理炉等家电设备,这也是目前加入 HarmonyOS 生态中推出家电产品数量最多的企业。</p><p><img src="/img/bVcKHrM" alt="美的 x HarmonyOS" title="美的 x HarmonyOS"></p><p>那么美的集团为什么选择率先加入 HarmonyOS 生态?推出如此多搭载 HarmonyOS 系统的家电设备究竟能带来哪些商业价值?美的与 HarmonyOS 的合作究竟是想达成怎样的目标?美的 IoT 智能连接专家陈挺博士在不久前接受了采访,分享了美的与 HarmonyOS 合作背后的种种战略思考与创新探索。</p><p><a href="https://www.qq.com/video/h3206e4el7i">https://www.qq.com/video/h320...</a></p><h2>共同发力 IoT,美的与 HarmonyOS 一拍即合</h2><p>陈挺坦言,之所以选择与 HarmonyOS 合作,最大的驱动力是因为美的集团在万物互联时代的发展战略,与 HarmonyOS 的服务支撑能力高度契合。</p><p>他透露,5G 商用加速了万物互联时代的到来,消费者对跨品类、跨行业、跨技术的万物互联的体验感提出了更高要求。美的意识到,智能家居企业必须具备横向整合家居服务产业链资源的能力,实现更多设备和服务的互联互通,打造开放共赢构建智慧生态圈才是致胜的关键。而 HarmonyOS 的出现,无疑是美的 IoT 未来发展的“神助攻”,不仅让更多终端设备互相连接,打破单一物理设备硬件能力的局限,而且能够实现不同硬件间能力互补和性能增强。</p><p>“HarmonyOS 具备分布式、多端部署、安全性和易开发等特点,这些无一不是5G时代中物联网发展的关键,因此顺理成章地成为美的 IoT 践行打造‘懂你的智慧生活’理念的最优选择。”</p><p>2020年7月,美的与华为共同宣布升级为战略合作伙伴,为消费者打造全场景智慧生活体验。针对 HarmonyOS 合作,双方成立联合项目组共研共创。在 9 月份的华为开发者大会 2020 现场,美的携手华为打造了一个美的品牌智慧厨房专区,其中搭载了 HarmonyOS 系统的家用空调、净水器、蒸烤料理炉等多个品类都是行业首发,吸引了众多参会者前来体验。</p><p>以外,美的和 HarmonyOS 团队还投入了大量精力一起打造了一套高效的智能家电开发流程。未来,智能家电的开发者可以基于这套流程进行搭载 HarmonyOS 的智能家电产品的快速研发和落地,共同推动智能家居产业的升级。</p><h2>带来全新操控体验,HarmonyOS 让美的与消费者“双赢”</h2><p>那么当美的设备接入 HarmonyOS 之后,究竟给消费者带来了哪些新体验呢?又给美的创造了哪些商业价值?</p><p>陈挺表示,“碰一碰”功能可能是最让消费者惊喜的操控功能了。在终端硬件上,消费者可以通过搭载 EMUI 11 的华为手机快速发现可连接的基于 HarmonyOS 打造的美的智能设备,碰一碰便可以实现 3 秒快速配网,无需下载应用,大大简化了配网方式,且配网成功率接近 100%。</p><p>在交互体验上,用户可通过多个入口进入美的智能家电控制页面,除了通过碰一碰的方式进行配网操控美的智能家电设备,还可以通过语音进行控制。在用户服务方面,美的与华为共同给用户打造无处不在的全周期服务体验,例如当消费者使用搭载有 HarmonyOS 的美的智能电饭煲完成米饭烹饪,华为手机或智能手表就会发送信息提示用户米饭已烹饪完成;当美的智能净水器滤芯需要更换时,用户也会收到搭载 EMUI11 的华为手机发送的提示,从耗材购买到售后服务都可以在搭载 EMUI11 的手机上完成。</p><p><img src="/img/bVcKHlh" alt="美的 x HarmonyOS" title="美的 x HarmonyOS"></p><p>“毫无疑问,HarmonyOS 在一定程度上提高了美的 IoT 设备联网速度,目前由于用户所处环境网络等问题会导致联网时间较长,家电设备搭载了 HarmonyOS 之后能够让这个连接过程减少至 3s,这让美的的 IoT 设备拥有差异化体验,大幅领先同质竞争产品。”陈挺表示。</p><h2>HarmonyOS因何不同?</h2><p>从事家电研发的专业人士都清楚,家电产品研发周期比较长,但是在美的 HarmonyOS 项目中,双方从 7 月立项到 11 月产品上市、供货双十一,其研发速度之快简直可谓是创造了业内奇迹。</p><p>这离不开美的团队的重视以及华为 HarmonyOS 团队给予的支持与帮助。据陈挺介绍,对于 HarmonyOS 这个项目,美的集团和各个事业部都非常的重视,包括七大产品事业部的研发,产品市场的人员以及 IoT 事业部相关人员都投入了大量的工作。</p><p>此外在整个项目过程中,华为 HarmonyOS 的团队同事从研发、测试到产品认证的各个方面都给予了美的充分的技术支持,在联合项目组成立以后,HarmonyOS 项目组的核心成员是直接被派驻到美的的办公室进行专门产品研发的现场支持,这些都为美的搭载 HarmonyOS 的产品能够顺利、按时上市提供了强有力的保障。</p><p>美的 HarmonyOS 项目进展之快也从另一个角度证明了 HarmonyOS 系统的易用性,更容易接入家电产品。例如开发工具平台 HUAWEI DevEco 提供了一站式集成开发环境,能够支持 HarmonyOS 组件按需定制、一键编译和烧录、可视化调试、分布式能力集成等操作,极大地提升了开发效率。</p><p>在运用 HarmonyOS 进行产品创新过程中,陈挺也明显感受到 HarmonyOS 系统和其他物联网 OS 平台的不同:</p><p>对于消费者而言,HarmonyOS 提供了极致的新一代连接体验,例如碰一碰的“无感配网”能够快速简化网络配置,并且直接调用服务无需安装和频繁点击 APP;</p><p>对于开发者而言,HarmonyOS 系统具备组件化和轻量级的设计,在性能、硬件功耗等方面充分优化,大大降低开发门槛,让设备开发能够很容易接入到 HarmonyOS 生态圈中;</p><p>对于设备厂商而言,无需再与其他设备厂商一一沟通共同合作来提供服务,因为基于同样的 HarmonyOS 系统,大家拥有一致性的体验、一致性的开发框架。设备厂商能够在 HarmonyOS 系统下形成一个超级终端,共享各自的能力,为消费者打造更好的生活体验。</p><p>在陈挺看来,HarmonyOS 是一个跨时代创新的操作系统,它不仅解决了 IoT 生态碎片化问题,而且能够给设备商、服务商提供同一个平台向消费者提供一致的服务,让人们不再为了享受智能生活动辄安装数十个 APP,也不再需要一个个手动设置设备联动,真正给人们呈现出一个智能化的生活场所。“HarmonyOS 值得期待,更值得参与其中。”</p><p><img src="/img/bVbMHIf" alt="segmentfault 思否" title="segmentfault 思否"></p>开源社副理事长陈阳:女性参与开源的广度和深度,让世界变得有趣和多元化https://segmentfault.com/a/11900000375855402020-10-23T22:29:41+08:002020-10-23T22:29:41+08:00思否编辑部https://segmentfault.com/u/writers7<p>从个人的角度,我更多看到<strong>开源是一种信仰,是技术理想主义者的精神家园,其文化外延超越了源代码本身。</strong> —— 开源社副理事长,陈阳</p><hr><p>2020 中国开源年会 (COSCon'20) 将于 10月24-25日由开源社举办,SegmentFault 思否社区为本次大会的战略合作媒体,并将进行独家的线上直播。</p><p>本次年会将采取线上线下相结合的形式,<strong>北京、上海、深圳、成都、长沙五城联动</strong>,11 个分会场,线上线下同时进行。</p><p>为了让大家进一步了解开源、了解本次 COSCon’20,SegmentFault 思否特别采访了陈阳老师。</p><p>陈阳老师是开源社副理事长,曾任 GNOME 基金会董事,GNOME.Asia 创办人,也是微软(亚洲)互联网工程院 AI 资深产品经理。</p><p>作为长期活跃于开源社区和开发者社区的一名开源布道师,在本次的开源年会中,陈阳老师将以开场嘉宾的身份出席「开源向善分会场」,并出席同期于北京举办的开源线下聚会活动。</p><p><img src="/img/bVcHRZE" alt="image" title="image"></p><p>以下为 SegmentFault 思否对陈阳老师的访谈内容:</p><hr><p><em><strong>1、在开源圈儿,您一般会如何介绍自己?</strong></em></p><p>很幸运,我比较早的接触到开源,并长期一直持续在社区进行贡献。最早参与到开源是从 2004 年开始,成为了 OpenSolaris 和 Mozilla 社区的核心贡献者。之后在 2008 年创建 GNOME.Asia 社区,2010 年任 GNOME 基金会董事,2014 年发起创办开源社,现在担任开源社的副理事长。</p><hr><p><em><strong>2、能否谈一下您对开源的理解?您认为开源的核心和精髓是什么?</strong></em></p><p>开源包罗万象,代码、技术、项目、开发者、用户、社区、企业、政府、许可证协议、法律等方方面面的角度,这些拼在一起,才能构建出开源的全貌。</p><p>从个人的角度,我更多看到<strong>开源是一种信仰,是技术理想主义者的精神家园,其文化外延超越了源代码本身。</strong>而我认为的开源核心,是分享,开放,平等,协作。</p><p>众人拾柴火焰高,开源有一种自底向上自发运营的生命力,有一种向善的力量。尤其在疫情爆发之后,我们看到大规模的开源社区协作的工作方式正在出圈,正在更有效地改变世界。</p><p>开源社的核心成员近期对开源的定义进行了一次内部探讨,并一起撰写发起了<strong>《开源人宣言》</strong>,这份宣言非常完整地诠释了我们对开源的理解,感兴趣的朋友可以搜索查看。</p><hr><p><em><strong>3、能否分享一下您对国内开源技术发展趋势的看法?</strong></em></p><p>这个问题可以从不同的角度展开去看:</p><p><strong>1)从时间的维度</strong></p><p>全球开源运动发起距今已有二十多年,管中窥豹,我观察到国内开源技术的发展其实存在着一些明显的趋势。</p><p>十几年前的时候,开源 = Linux,Linux 操作系统、桌面办公软件(GNOME, OpenOffice)和浏览器(Mozilla)作为当时开源项目的主战场,掀起了第一波开源的浪潮;</p><p>近十年随着互联网的兴起,开源的项目和技术越来越百花齐放,从数据库到中间件,从前端到后端,从编程语言到编译器,从物联网到微服务,从大数据到人工智能,开源的技术和项目越来越丰富和多样化;</p><p>最近五年,随着移动互联网和云计算在中国的蓬勃发展,我们看到了中国开源崛起的力量。<strong>从时间这个维度,我们清晰看到中国开源从早期的跟随者、参与者,逐渐变成影响者和创作者。</strong></p><p>中国开始涌现出大量开源项目的创作者,中国企业的开源项目开始捐献给基金会孵化,中国开始定义自己的开源许可证协议(木兰宽松协议)并被 OSI 接受,中国开始成立中国的开源基金会(开放原子基金会),这些都是中国开源开始成熟的很重要的标志。</p><p><strong>2)集中与分布式</strong></p><p>在早期的时候,开源主要集中在几个主要社区,这些社区成熟的标准之一就是 是否有开源基金会。当然全球的开源基金会也是掰着手指头可以数出来的,如经典老牌的 Linux、Apache、Mozilla 基金会等,聚集了一大群优秀的开源人才和企业的参与,并且在长达 20 多年的开源历程中经久不衰。这是经典的开源 1.0 模式。</p><p>当开源技术开始多元化,尤其当代码的分享和开发变得便捷,基于 Git 的代码托管平台的流行,开源进入了一种新的分布式状态。<strong>更细分领域技术和项目的出现,促成了更低的沟通成本和更多开源人才的聚集。</strong></p><p>如同互联网早期是通过主要的门户网站来服务于全球网民,发展至今每个人都很容易创建并运营自己的自媒体账号。</p><p>2019 年 GitHub 发布的行业报告中,用户群和活跃贡献度排名第二的是中国,我们看到了中国开源环境的成熟以及呈分布式状态发展的势头。这也意味着进入到了开源 2.0 模式。 </p><p><strong>3)小众与出圈</strong></p><p>十几年前,我们参加北京 Linux 用户组,经常会去北京一家位于东直门的餐厅的地下一层,“地下”这个词有着双重含义。那个时候的开源圈子,还鲜为人知,活跃于一小群早期的开源人之间。到了 2020 年的今天,开源呈现出一种出圈的状态。</p><p>在横向上,更多的领域开始谈论开源,开始了解开源。近年以来,政府部门开始关注开源,学校开始推广开源的课程和认证,企业们开始考虑成立开源委员会,VC 创投开始垂青开源项目,开源已经成了多轮融资以及上市评估一个非常重要的维度和评价方向。</p><p>纵向的从开源项目之间去看,我们观察到的更多是「融合」,领域之间的界限开始模糊,开源项目之间的界限开始模糊。</p><p>最近做了一个实验,用知识图谱的可视化去展示中国 Apache 项目贡献者之间的关系。通过这个知识图谱,我们看到有两个开源项目之间共享着同一群中国开发者。(有意思的问题来了,你一定很想知道这些开发者是被哪些企业雇佣了。COSCon'20 的人工智能专场将会分享这些有意思的数据发现。) </p><p><strong>4)从个人到生态</strong></p><p>中国开源社区早期的时候更多是以用户的方式去参与,这也是为什么我们会听到北京某某用户组,上海某某用户组。</p><p>到了 2020 年,我们比较少听到新成立某某用户组这个词了,更多地听到了联盟、基金会、行业联盟、组织。这意味着开源不再是以个人用户的方式在参与,而是以开发者、项目、企业、联盟、基金会的方式来呈现,这也同样印证了中国开源的成熟,规模化,进阶和蓬勃发展的势头。</p><hr><p><em><strong>4、您认为什么样的开源项目算是优质的开源项目?有没有一些评判标准?</strong></em></p><p>优秀的开源项目都是相似的, 我们可以从一些客观指标上去衡量:</p><p><strong>- 用户规模:</strong>Star/Fork/Issue/Watch 的数量,Code 的行数,活跃贡献成员的人数,能被更多人使用、被更多人需求,是项目是否有价值的一种标志。</p><p><strong>- 活跃频率:</strong>代码提交的频率,需求提交的频率。</p><p><strong>- 活跃范围:</strong>活跃范围是指在同一组织内部的贡献人数,以及企业/组织以外的活跃贡献者人数。组织外部的活跃贡献者是一个很重要的健康指标。</p><p><strong>- 清晰的商业模式:</strong>开源项目针对广大用户不收钱,但是 To B 市场是愿意为服务和定制化买单的。比如 Red Hat 的 RHEL 企业版专业服务是需要收费的。</p><p><strong>- ISV/合作伙伴的数量:</strong>平台级开源项目通常都会有上下游的合作伙伴参与,不仅提供服务、为企业作定制化开发,也在平台上开发更多更丰富的应用。例如操作系统上的应用软件,输入法等基础应用都需要通过 ISV 来一起合作开发。</p><p><strong>- 文档/本地化:</strong> 建立完善的开发者文档和手册后,能否匹配本地化的语言也非常重要。如果仅仅只有中文的文档,在全球社区的影响力就会非常有限。开源分享的本质决定了开源是需要在世界范围内相通的。</p><p><strong>- 社区活动:</strong>不论是线上还是线下,活动对于开源社区来说,都是非常重要的联系手段。大家会为了代码和项目而来,但是因为认识了社区里面的人,大家产生了归属感,才能让这个社区产生持久长期的凝聚力。</p><p>例如今年的中国开源年会 COSCon'20,成千上万人将通过线上直播,或是通过线下 5 个分会场参与其中。国际开源友人跨过时区和地域的限制,与我们中国开源项目的核心贡献者们,一起来分享上百个开源话题,这让 COSCon 成为了一年一度中国开源人期待的盛会。</p><p>优秀的开源项目需要这样的一个舞台。</p><hr><p><em><strong>5、随着社会的发展,女性标签正在逐渐被弱化,但社会仍期待女性可以为不同的领域带来一些特有的价值与意义。您认为对于开源领域来说,女性成员的加入会带来哪些变化与不同?</strong></em></p><p>多元化一直是开源社区的口号,开源社区在十几年前就开始发起了“鼓励女性参与开源”的号召;GNOME 基金会也在很早就提出了 GNOME Women Outreach Program,鼓励女性学生以实习的方式参与开源项目;LinuxCon、GUADEC 等大会上,经常会设置女性晚宴,组织开源社区中的女性来进行分享。</p><p>在这样的氛围中,我们看到了杰出女性成为开源社区中的领袖,以她们独特能力和视角将整个社区链接起来。像这次大会我们邀请到三位主题演讲的女性讲师,都是最好的例子。</p><p>GitHub COO Erica Brescia,管理着超过 5000 万程序员的社区;Stormy Peters,从 GNOME 基金会执行总监,到现在负责着微软的开源办公室;来自亚洲越南的 Hong Phuc,从创办 FOSSASIA 开始参与开源,目前出任着 OSI 的董事会 VP。</p><p>我身边有很多的女性开发者,每天做着自己喜欢的编程工作,沉醉其中;我们也可以看到女性对一些领域的独特洞察和兴趣,进而发现机遇,比如在教育等领域开创新的项目和创业公司等。</p><p><strong>女性参与开源的广度和深度,正在按照我们所期望的方向发展,让这个世界变得有趣和多元化。</strong>这也是开源向善含义的外向化体现,是开源正在改变世界的一个角度。</p><hr><p><img src="https://mmbiz.qpic.cn/mmbiz_png/o9U5iaeuAciaDJQeYuLjpBpDbT92o34se404lWK119SDuYKFyibr1nEadhbhmeER3slKNwPw4GQUcwkMrpibGcEDTg/640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1" alt="" title=""></p><p>10月25日,陈阳老师将作为「开源向善」分论坛的首位出场嘉宾致欢迎辞。该场分论坛大咖云集,来自于国内外领头羊的开源基金会和企业领袖,将和观众分享开源运动与开源技术的最新发展和开源向善的本质与实践是如何改变了世界。</p><p><em>以下为活动日程及嘉宾名单</em></p><p>☟☟☟</p><p><img src="https://mmbiz.qpic.cn/mmbiz_png/aVp1YC8UV0dzpLHzhtnbYq85Dx4nDqkichPLibNhNNIqbo9jxYgPqib5JICib9qeoSoEoUseZ4BW6Tsvh3CEQzF6UQ/640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1" alt="" title=""></p><p><img src="https://mmbiz.qpic.cn/mmbiz_png/aVp1YC8UV0dzpLHzhtnbYq85Dx4nDqkicdicunscy3a23RAuZZ3KdNszX7zZKUuicNULS6PEg2ZOKtibHd3O8atgow/640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1" alt="" title=""></p><p>*更多主题信息以会议当天内容为准</p><hr><p><strong>报名方式 & 直播链接</strong></p><p>对 COSCon'20 内容感兴趣的你,可以通过下方的链接或点击阅读原文进行报名,期待你的参与!除了在线上观看直播外,本次峰会将在<strong>北京、上海、深圳、成都、长沙</strong>五城展开线下聚会,审核通过后即可免费报名参加~</p><blockquote>会议报名链接:<a href="https://link.segmentfault.com/?enc=SEfgz97SjxfOjwRFGujasQ%3D%3D.3Mr5wCiBXQL52hYRhXXLMcuie175QBs5yHY3C9sLfxVBgUPiiTjvd43i3hkQ6s8q" rel="nofollow">https://www.bagevent.com/even...</a><br>线上直播链接:<a href="https://segmentfault.com/area/coscon-2020">https://segmentfault.com/area...</a></blockquote><p><img src="/img/bVbOFol" alt="segmentfault 思否" title="segmentfault 思否"></p>开放原子基金会 TOC 主席堵俊平:开源的本质是“人与人基于代码的联结”https://segmentfault.com/a/11900000375855092020-10-23T22:26:20+08:002020-10-23T22:26:20+08:00思否编辑部https://segmentfault.com/u/writers7<p><strong>国内的开源社区目前发展势头很好,但同时也面临着叫好不叫座的尴尬境地。</strong> —— 开放原子基金基金会主席,堵俊平</p><hr><p>2020 中国开源年会 (COSCon'20) 将于 10月24-25日由开源社举办,SegmentFault 思否社区为本次大会的战略合作媒体,并将进行独家的线上直播。</p><p>本次年会将采取线上线下相结合的形式,<strong>北京、上海、深圳、成都、长沙五城联动</strong>,11 个分会场,线上线下同时进行。</p><hr><p>为了让大家进一步了解开源、了解本次 COSCon'20,SegmentFault 思否特别采访了本次大会的嘉宾堵俊平老师。</p><p>堵俊平老师是开放原子基金基金会 TOC 主席,LF AI 基金会董事,Apache 基金会 Member,Hadoop 等项目的 Committer 以及 YuniKorn、TubeMQ 等项目的导师,也是华为的高级专家、云与计算 BG 的开源业务总经理,负责华为在云与计算领域整体的开源工作。</p><p>以下为 SegmentFault 思否对堵俊平老师的访谈内容:</p><hr><p><img src="/img/remote/1460000037585512" alt="" title=""></p><p><em><strong>1、网上有很多关于您的资料介绍,您一般倾向于如何介绍自己?</strong></em></p><p>一个开源社区的长期贡献者,这是我最骄傲的身份。</p><hr><p><em><strong>2、能否谈一下您对开源的理解?您认为开源的核心和精髓是什么?</strong></em></p><p>开源这个话题很大。对开源的一个通常的误解就是公布源代码,其实开源远不止如此。</p><p>首先,代码公开可获得并不是开源的充分条件,业界有个组织叫 OSI 专门来定义开源,一个真正的开源项目除了代码公开可获得,还需要满足代码可修改,可分发等要求。</p><p>其次,开源界有个基本共识,就是社区远大于代码,或者说由人来构成的开源社区远远比代码重要的多。<strong>基于代码,构建一个“我为人人,人人为我”的追求创新、有温度的技术社区,是项目成败的关键。</strong></p><p>基于此,我所理解的开源本质是<strong>“人与人基于代码的联结”</strong>。这样看来,之前 GitHub 被人戏称为全球最大的同性社交平台的说法也不是没有道理。</p><hr><p><em><strong>3、能否分享一下您对国内开源技术和产品的看法?</strong></em></p><p>首先我认为开源技术是无国界的,开源代码从公开的那一刻起就是属于全世界的共同财富。正因为开源技术的这种利他性,破除了很多创新的壁垒,让我们的创新工作可以站在巨人的肩膀上。</p><p>从另一方面来看,我们有很多的开源项目缺乏原创性,并没有明显的技术或者应用优势,感觉是为了开源而开源。<strong>其实开源是手段而不是目的,有些公司和组织在开源项目和宣传上偏重数量而非质量,这显然有一定的误导性。</strong></p><p>当然,相对于几年之前,国内的开源氛围和成果已经进步了很多,一是高层的广泛关注和重视,很多企业,比如华为、腾讯等都建立了公司级的组织机构,并把开源列为公司级发展战略,我们也有了自己的开放原子开源基金会,开源领域的头部创新公司都踊跃来参与;</p><p>二是开源的人才和项目蓬勃发展,我在 7 年前成为国内第一个 Hadoop 项目的 Committer 的时候,那个时候国内的 Committer 和开源贡献者可以说是凤毛麟角;到后来经历了以开源为主的云计算(openstack), 大数据(Hadoop, Spark),云原生(K8s),AI (TensorFlow, PyTorch) 等一波又一波的技术浪潮的洗礼,越来越多的贡献者了解并参与到开源的大家庭里来。</p><p>当然,从项目维度上看,我们也取得了很不错的进展,从 Kylin 项目开始,我们已经累积有 20 多个项目捐献给 Apache 基金会;在 Linux 基金会方面,除了项目捐献,我们今年有两个项目分别是源自腾讯的 TARS, 和源自华为的 SODA 项目在 Linux 旗下成立了子基金会,发展了很多全球的会员加入到社区贡献。</p><p>AI 是公认的 IT 技术领域皇冠上的明珠,这两年国内开源的几个新兴的框架型项目,比如 MindSpore,Angel 等,都是有独到技术特色的优秀项目。有企业大力度的投入资源,也有优秀的人才以及项目积累,国内出现具备全球影响力的开源项目和产品只是时间问题。</p><hr><p><em><strong>4、您认为什么样的开源项目算是优质的开源项目?有没有一些评判标准?</strong></em></p><p>对于优质或者说成功的开源项目,业界其实没有一个严格的标准。有些观点倾向于结果性指标:比如项目的用户量(下载量,部署量,引用量等),在业界的技术影响力,产生的商业价值等等;有些倾向于过程性指标:比如社区的健康度(贡献者数量、分布以及活跃度)等。</p><p>在我看来,这些都是评价一个开源项目当前是否优秀可以参考的因素。但我更看重的是,项目背后的社区是否能支持项目持续发展。</p><p>这些因素包括:社区的信息和讨论是否公开、透明,从而营造出一个可信赖的工作氛围;社区是否鼓励创新创造,不断的吸引有想法,有能力,有意愿的贡献者来加入;社区治理机制是否完善,是否充分考虑到开发者、使用者、生态拓展者等各个角色的利益和意愿等等。</p><p>这些因素决定了一个项目未来发展的潜力,也就是能走多远。</p><hr><p><em><strong>5、您和您的团队在开源的整体过程中,遇到的最大挑战是什么?又是如何解决的?</strong></em></p><p>在企业内部做开源,最大的挑战之一是解释清楚开源相关的工作与业务的关系。企业不是慈善团体,做任何决策往往都从自身的商业利益出发。只有解释清楚了,才能赢得高层的支持以获得相关的资源投入到开源工作。</p><p>由于开源天生具有利他属性,通过把握好这一点,让开源项目真正为用户和合作伙伴的利益服务,培养信任以及共同的利益,自然也能助力业务上的突破。</p><p>在基金会里做开源,由于很多公司彼此间有一定的业务冲突,在这种情况之下如何让大家能坐下来谈合作,而不是各玩各的,是很有挑战的。</p><p>我们开放原子 TOC 团队的共识是<strong>以技术的客观性为共同的判断依据,最大程度的发挥技术中立的原则,来构建充分信任和合作的平台</strong><strong>,让开源项目成为各家普惠的工具而非独家垄断的武器。</strong></p><hr><p><em><strong>6、开源社区应该如何协调与商业宣传的关系?</strong></em></p><p>首先,开源与商业并不是矛盾的关系,我们近年来看到很多主流的开源许可证,例如 Apache v2 都是商业友好型的 license。这类许可证被设计出来,就是为了促进商业推广,从而造就了开源的空前繁荣。从这个意义上来说,开源与商业有某种意义上的相互配合的关系。</p><p>但从另外的角度而言,两者的区别也比较明显,商业宣传会着重面向付费客户,尤其是头部客户,宣传的口径和场景也会为重点客户而量身订造;而开源社区的推广主要是面向最终用户和开发者,着重覆盖最广泛人群,而不大会关心人群背后的商业属性。</p><p>开源社区作为一个包容性的群体,应该允许商业化组织进行技术和产品的宣传与推广工作,但要避免商标被侵权和滥用,以及由可能的夸大事实而造成的负面影响。</p><hr><p><em><strong>7、商业公司应该如何拥抱开源?</strong></em></p><p>如上面所说,商业和开源不但不矛盾,而且在很多场景下都是相互促进的关系。<strong>就商业公司而言,想清楚为什么开源以及找到适合自己业务的开源商业模式是首当其冲的问题。</strong>找到开源与核心业务的本质联系之后,如何做好开源就成为下一步的问题。</p><p>公司可以基于自身的特性和业务场景,将一些有技术竞争力的优秀项目开源,同时加强项目的运营能力,从而构建起开发者与合作伙伴的繁荣生态。如果开源项目对公司的战略有重大影响,就更应该组建专业化的开源团队对项目进行独立运营与推广,尤其对牵涉范围比较广,有机会成为事实标准的潜力型项目而言。</p><p>如果业务需求仅仅是用好开源,发挥好公司在开源社区里用户的角色即是至关重要的:提供差异化的场景输入,以及社区解决方案的落地与反馈等,对于开源的项目发展以及实现自身的业务增长往往能达成双赢的结果。</p><hr><p><em><strong>8、在您的观察中,国内的开源社区发展到了什么阶段?现阶段最重要的事情是什么?</strong></em></p><p>上面也提到,经过几年的蓬勃发展,<strong>国内的开源社区目前发展势头很好,但同时也面临着叫好不叫座的尴尬境地。</strong></p><p>一方面,由于很多同质化的项目出现,造成了特定场景用户的分流,比较难形成资源的积聚效应;另外一方面,开源项目商业成功的案例在国内还比较少见,开源商业模式在国内的最佳方案需要不断的探索与实践。</p><p>现阶段,我们希望涌现出来的优秀或者说有潜质的项目通过开放治理和运营等手段,真正团结起最广大的开发者来加入贡献与创造;同时,商业公司在开源的商业推广路径上做更多的尝试,帮助开源社区的项目尽快落地推广,发挥业务价值;最后,我们也希望开源的组织尤其是基金会能尽快完善组织级能力,更好的服务和支撑优秀项目社区的各项活动。</p><hr><p><img src="/img/remote/1460000037556271" alt="" title=""></p><p>作为长期活跃于开源社区和开发者社区的一名开源布道师,在本次的开源年会中,堵俊平老师将在 10 月 24 日的主会场中以<strong>《终于来了, 开放原子101: 从组织到项目》</strong>为主题进行分享。</p><p>届时堵俊平老师将重点介绍开放原子基金会的技术监督委员会组成以及将起到的作用,并介绍当前已经在孵化阶段的各个项目,以及目前基金会所处的发展阶段。</p><p><em>以下为10月24日主会场日程概览</em></p><p>☟☟☟</p><p><img src="/img/remote/1460000037556341" alt="" title=""><img src="/img/remote/1460000037556340" alt="" title=""></p><p>*更多主题信息以会议当天内容为准</p><hr><p><strong>报名方式 & 直播链接</strong></p><p>对 COSCon'20 内容感兴趣的你,可以通过下方的链接或点击阅读原文进行报名,期待你的参与!除了在线上观看直播外,本次峰会将在<strong>北京、上海、深圳、成都、长沙</strong>五城展开线下聚会,审核通过后即可免费报名参加~</p><blockquote>会议报名链接:<a href="https://link.segmentfault.com/?enc=VXb5IJQspnxY4iu%2FcEgPqg%3D%3D.f2KueB767KAjC8ZFlR30Sr%2FRa71jRyr7GqnaDo4LZnWDbJbHlVzCj2i0x2lkSZ4z" rel="nofollow">https://www.bagevent.com/even...</a><br>线上直播链接:<a href="https://segmentfault.com/area/coscon-2020">https://segmentfault.com/area...</a></blockquote><p><img src="/img/bVbOFol" alt="segmentfault 思否" title="segmentfault 思否"></p>Web/JavaScript 全栈开发者水歌:开源之“道”的三股势力https://segmentfault.com/a/11900000375854892020-10-23T22:22:36+08:002020-10-23T22:22:36+08:00思否编辑部https://segmentfault.com/u/writers6<p><strong>开放、平等、自主的社会化协作</strong>是放之四海而皆准的<strong>最佳实践</strong>,是来自开源界的馈赠。—— Web/JavaScript 全栈开发者,水歌</p><hr><p>2020 中国开源年会 (COSCon'20) 将于 10月24-25日由开源社举办,SegmentFault 思否社区为本次大会的战略合作媒体,并将进行独家的线上直播。</p><p>本次年会将采取线上线下相结合的形式,<strong>北京、上海、深圳、成都、长沙五城联动</strong>,11 个分会场,线上线下同时进行。</p><p>为了让大家进一步了解开源、了解本次 COSCon'20,SegmentFault 思否特别采访了水歌老师。</p><p>水歌是一位 <strong>Web/JavaScript 全栈开发者</strong>,也是 WebCell 前端开源框架作者,现任 freeCodeCamp 成都社区负责人、开源社执委会成员、微软最有价值专家(开发者技术领域),日常爱好音乐、电影、汉服、滑雪。</p><p>长期活跃于开源社区的他,致力于<strong>在开放生态中为社会创造价值</strong>。在本次的开源年会中,水歌老师将以出品人及主持人的身份掌舵「Web 全栈及其他」分论坛,并出席同期于成都举办的开源线下聚会活动。</p><p>以下为 SegmentFault 思否对水歌老师的访谈内容:</p><hr><p><img src="/img/remote/1460000037585492" alt="" title=""></p><p><em><strong>1、如果需要给“开源”下一个定义,您认为是什么?</strong></em></p><p>开源一词虽源于“开放源代码”,但公布源码仅为其表面,其核心是一种<strong>开放式社会化协作</strong>,所以<strong>开源硬件、开放文档、基于 Creative Commons 协议的开放文艺作品</strong>等,乃至公益、慈善机构等开放社群,皆为开源。</p><hr><p><em><strong>2、您认为开源对于开发者来说,最大的价值和意义是什么?</strong></em></p><p>对个人开发者是一种<strong>能力的锻炼与证明</strong>,对企业是一种<strong>更高效的创新与营销模式</strong>。</p><hr><p><em><strong>3、您认为什么样的开源项目算是优质的开源项目?有没有一些评判标准?</strong></em></p><p><strong>社群开放、平等、自主</strong>,剩下的<strong>高质量的代码、清晰的文档、自动化的工作流</strong>等等,便纷至沓来~</p><hr><p><em><strong>4、能否分享一下您对国内开源技术和产品的看法?</strong></em></p><p>国内 IT 业在技术、产品上虽与欧美还有差距,但开源界还是有不少开始显现全球影响力的项目,这些“术”的层面对勤奋钻研的华人而言并非不可逾越的鸿沟。</p><p>但从“道”的层面看,<strong>完整的开源界由三股势力构成</strong>:</p><p>1)草根开发者社群:所谓<strong>“市集”</strong>,也是自由软件、开源软件的诞生地</p><p>2)公司开源团队:所谓<strong>“大教堂”</strong>,一般是<strong>开源商业公司</strong>(RedHat 等)或<strong>开源转型的传统公司</strong>(Microsoft 等)</p><p>3)开源基金会:依赖开源的公司捐款给基金会,基金会招募草根开发者</p><p>反观中国大陆:</p><p>1)只有大公司以 KPI 的方式做开源比较强,<strong>以开源为核心商业模式的公司</strong>凤毛麟角</p><p>2)纯民间的基金会仍有政策上<strong>免税、公募资格</strong>的很大门槛,现在完全称不上气候</p><p>3)而我国最不缺的人,却几乎没有前文所述“开放、平等、自主”之意识,除了现在人人都使用开源软件,但在<strong>社群影响力</strong>上比十年前并没强多少</p><p>因此,我很赞同某同仁的一个观点 ——</p><p>若国人只学习洋人的技术,而不学习<strong>诞生创新技术的社会氛围</strong>,那就永远只能做跟随者,今日中国之开源只能是一场<strong>“新洋务运动”</strong>!</p><hr><p><em><strong>5、您在具体开源的过程中遇到的最大的挑战是什么?</strong></em></p><ul><li>当你有个好想法时,别人说:你先做个样子我看看~</li><li>当你写了个原型时,别人说:你做稳定了我再试试~</li><li>当你发了稳定版时,别人说:你生态完善了我就用~</li><li>当你写完周边库时,别人说:你有大厂项目社区大?</li></ul><hr><p><em><strong>6、对于开源行业未来的发展,您有什么期待?</strong></em></p><p>期待中国大陆有更多人参与开源项目、开放社群,而不只是做个成品使用者、活动围观者。</p><hr><p><em><strong>7、您认为开源的概念和文化,有哪些可以被借鉴到其他领域?其他领域的文化有哪些可以被开源行业所参考?</strong></em></p><p><strong>开放、平等、自主的社会化协作</strong>是放之四海而皆准的<strong>最佳实践</strong>,是来自开源界的馈赠。</p><p>而在开源人的交流上,我近两年在借鉴境外技术嘉年华、境内 ACG 漫展,努力尝试「开源市集」这种活动形式,期望技术宅们能多走出来联络,不能只在电脑前面闭门造车:</p><blockquote><a href="https://link.segmentfault.com/?enc=W4ja2I%2F7MgV9j85Wtxw9Sw%3D%3D.D6hquFnBeHSqLeG5VL2CozTbuZ1IgpsM9BovK3V8FmY%3D" rel="nofollow">1)2018 成都 Web 前端大会「开源市集」</a><br><a href="https://link.segmentfault.com/?enc=Cf6wlxByssSG6GYRsi6pEg%3D%3D.dqzMgPve5r%2F%2BUMQ9BipltnGU7aBSrEONCiladrDwSZw%3D" rel="nofollow">2)2020 中国开源年会·成都分会场「开源市集」</a></blockquote><p>欢迎大家踊跃参与今年 COSCon'20 的开源市集,我也会经常分享我的开源经验,并支持更多有心的小伙伴参与开源~</p><hr><p><img src="/img/remote/1460000037556271" alt="" title=""></p><p>10月25日,水歌老师将作为「Web 全栈及其他」分论坛的主持人。以下为该论坛的活动日程及嘉宾名单:</p><p>☟☟☟</p><p><img src="/img/remote/1460000037585493" alt="" title=""></p><p><img src="/img/remote/1460000037585494" alt="" title=""></p><p>*更多主题信息以会议当天内容为准</p><hr><p><strong>报名方式 & 直播链接</strong></p><p>对 COSCon'20 内容感兴趣的你,可以通过下方的链接或点击阅读原文进行报名,期待你的参与!除了在线上观看直播外,本次峰会将在<strong>北京、上海、深圳、成都、长沙</strong>五城展开线下聚会,审核通过后即可免费报名参加~</p><blockquote>会议报名链接:<a href="https://link.segmentfault.com/?enc=iOE9sKvDxWPMimhucHRE7A%3D%3D.y102vgY5MGsHZ7b6ZEpvEJgJne4yjqq5S2rYw0rVoqj4ZuvP33mp1Xk1Uk7Pq89Q" rel="nofollow">https://www.bagevent.com/even...</a><br>线上直播链接:<a href="https://segmentfault.com/area/coscon-2020">https://segmentfault.com/area...</a></blockquote><p><img src="/img/bVbMHIf" alt="segmentfault 思否" title="segmentfault 思否"></p>从受益者到贡献者,朱凯的 ClickHouse 升级之路https://segmentfault.com/a/11900000375698832020-10-22T18:11:32+08:002020-10-22T18:11:32+08:00思否编辑部https://segmentfault.com/u/writers8<blockquote><strong>内容提要:</strong>由开源社举办的 2020 中国开源年会 (COSCon'20) ,即将在本周末拉开帷幕。HyperAI超神经一直以来都关注开源领域的动向,我们对本次开源大会讲师朱凯进行了专访,在此分享他参与开源事业十年以来的经历与感悟。<p><strong>关键词:</strong>ClickHouse DolphinScheduler 开源<br><strong>作者:</strong><a href="https://segmentfault.com/u/chaoshenjinghyperai">超神经HyperAI</a></p></blockquote><p>在 IT 领域从业 10 年,朱凯说,自己的整个职业生涯都在和开源软件打交道。</p><p>这十年间,他一边见证着国内开源环境的巨大变化,一边从开源项目的普通用户,升级为知名开源项目 ClickHouse、Apache DolphinScheduler 等的重要贡献者。</p><p><img src="/img/remote/1460000037569888" alt="" title=""></p><p><strong><em>十年职业生涯,也是他在开源领域的升级之路</em></strong></p><p>朱凯说,投身开源事业,开拓了他的视野,也让他拥有了更大的舞台。</p><h2><strong>被性能惊艳,投身 ClickHouse 布道</strong></h2><p>近年来,用于线上分析处理的开源列式数据库 ClickHouse,在国内外技术社区受到极大关注,同时也深受科技大厂的青睐,今日头条、腾讯等都纷纷将其投入大规模使用。</p><p><img src="/img/remote/1460000037569887" alt="" title=""></p><p><em>开源四年,该项目在 GitHub 上的 star 数就已达到 12.5k丨增速惊人,远远超过其它同类项目</em></p><p>2017 年 4 月,在朋友的推荐下,朱凯第一次接触到 ClickHouse。这个由俄罗斯互联网巨头 Yandex 开源的 OLAP 数据库,以碾压性的性能优势,给朱凯留下了极为深刻的印象,他从此便成为了 ClickHouse 的忠实粉丝。</p><p>举例来说,<strong>在 1 亿数据集大小的情况下,ClickHouse 的平均响应速度超越了多个 OLAP 开源引擎,</strong>比如是 Vertica 的 6.08 倍、 Greenplum 的 18、Hive 的 126 倍以及 MySQL 的 429 倍。</p><p><img src="/img/remote/1460000037569889" alt="" title=""></p><p><strong><em>ClickHouse 与其它引擎</em></strong><em>查询处理时间对比丨(时间越短越好)</em></p><p>经过一番对比论证,朱凯和团队很快就用 ClickHouse 完全替换了当时正在使用的同类产品,相关性能得到了很大的提升。</p><p>作为一名使用者,<strong>朱凯在学习和使用过程中,会将发现的 bug 即时上报,也会翻译一些英文文档。</strong></p><p>随着他对 ClickHouse 的理解越来越深入,也渐渐发现了一些问题。「ClickHouse 的学习资料实在匮乏,除了官方手册之外,基本没有其他成体系的资料。即便是官方手册,也缺乏一些原理性的解释。」</p><p><strong>作为一个 ClickHouse 的受益者以及贡献者,朱凯觉得自己还可以做更多来回馈项目。</strong></p><p>2018 年底,朱凯决定将自己在实践和学习过程中的经验进行整理和总结,并编写成书,希望将这些知识分享给更多开发者。</p><p>2020 年 5 月,仅仅经历了一年半的时间,他编写的《ClickHouse 原理解析与应用实践》便出版了。</p><p><img src="/img/remote/1460000037569886" alt="" title=""></p><p><strong><em>据了解,这是当前市面上第一本关于 ClickHouse 的书籍</em></strong></p><p>朱凯在书中对 ClickHouse 的时代背景、发展历程、核心概念、基础功能、运行原理等进行了全面介绍与解读,帮助更多人快速了解 ClickHouse。此外,由于技术的迭代很快,朱凯还特地运营了公众号「ClickHouse的秘密基地」,以作补充。</p><p>就是这样,不满足于只做一个受益者,朱凯将自己对于开源的热爱,写进了开源项目的代码里和书籍里。这也是开源教会他的,<strong>不仅仅是作为单纯的信息接受者,也要学会做一个信息输出者。</strong></p><h2><strong>从 User 到 Committer,参与开源并不难</strong></h2><p>除了 ClickHouse,作为一名资深开源贡献者,朱凯还是明星开源项目 Apache DolphinScheduler 的 Committer。</p><p>今年 4 月,得知自己成为 DolphinScheduler Commmitter 时,朱凯感到特别激动,「在我的价值观体系里面,对于一个程序员来说,能够成为 Apache Committer,能够拥有 Apache 邮箱,那绝对是至高无上的荣耀。」</p><p><img src="/img/remote/1460000037569891" alt="" title=""></p><p><strong><em>该项目于 2019 年 8 月进入 Apache 基金会丨是中国第 16 个进入 Apache 基金会的项目</em></strong></p><p>激动之余,他也和其他开发者分享了自己在开源领域这些年的感悟。</p><ul><li><strong>学习规则很重要。</strong>每个地方都有着自己的游戏规则,既然我们要参与其中,认同并遵循它的文化理念自然很重要。<p>以 ASF(Apache 软件基金会,Apache Software Foundation)为例,ASF 遵循精英自治,投票文化,具体细节建议大家搜索「Apache 之道」详细了解一下。</p></li><li><strong>想做贡献,可做的不仅仅是写代码。</strong>很多人,包括我在内,在很长时间内一直以为只有提交代码才算做贡献,其实并不是。<p>贡献的形式是多种多样的,包括代码、编写文档、社区问题答疑、提 issue、宣传布道等各种形式。<strong>所以找到你擅长的领域,持续输出、持续贡献即可。</strong></p></li><li><strong>参与开源,可以「各怀鬼胎」。</strong>从小的英雄主义教育我们,英雄到最后很可能都是会受伤、要牺牲的。所以很多人,包括我在内,在很长时间内认为搞开源是件很神圣的事情,不能带有杂念,只能利用个人时间付出、不能有收益,否则就是「不纯洁」。<p>其实并不是,经验告诉我们,<strong>一件事情如果没有利益驱使,是无法持续长久的。只靠一时激情,也就只能换来三分钟的热度。</strong></p></li><li><strong><em><em>快速迈出第一步。</em></em></strong>很多时候,我们总是停留在设想(YY)、规划(自嗨)阶段,迟迟不愿有所行动,殊不知迈出第一步是何等的重要。这是破圈的开始,站在圈外观摩,和身在其中是完全不同的体验。如果你想参与开源,成为开源项目的 Contributor,从现在就开始吧!</li></ul><h2><strong>国内开源的未来:满怀信心</strong></h2><p>回溯过去,中国的开源项目大概始于 1995 年左右,至今不过二十多年的历史。</p><p>但这二十多年时间国内开源经历了可谓翻天覆地的变化。朱凯就亲历了近十年来国内开源环境的变化,并由衷感慨:「开源的氛围在国内是越来越好了,特别是在 2019 年。」</p><p>为什么这么说?朱凯解释道:「很多圈内人都在说 2019 年是中国开源的爆发之年。<strong>的确,</strong><strong>这一年,在 GitHub 全球 4000 万注册用户中,来自中国的开发者在数量和贡献度上均排名第二。</strong>中国的活跃开源项目贡献者,有 40% 以上是在 2019 年加入的。」</p><p><img src="/img/remote/1460000037569890" alt="" title=""></p><p><strong><em>中国在 GitHub 的开发者数量增长迅速丨数量位居第二,**目前仅次于美国(</em></strong><strong><em>信息来源:CSDN)</em></strong></p><p>以朱凯自身比较关注的 Apache 基金会来说,截止到 2019 年底,已经有 16 个中国的开源项目进入了 Apache 基金会。也有越来越多的中国人成为了 Apache 的 Member。</p><p><img src="/img/remote/1460000037569892" alt="" title=""></p><p><strong><em>据统计,截至 2020 年 4 月丨全球共有765 位 ASF Member,其中华人 40 名</em></strong></p><p>如今,中国也有了自己的开源协议 「木兰宽松许可证 」和 开源基金会 「开放原子开源基金会」,一切都在逐步推进。</p><p>这些变化,都让朱凯对国内的开源事业抱有很大信心:「我相信今后大家参与开源的门槛会越来越低、中国本土的开源力量会越来越强大。」</p><h2><strong>COSCon'20 报名进行中,朱凯老师在等你</strong></h2><p><strong>业内最具影响力的开源年度盛会 2020 中国开源年会(COSCon'20)将于 10 月 24-25 日召开。</strong>今年的嘉宾分享将采取线上线下相结合的形式,从人工智能、开源治理、数据技术、教育与公益等 11 个方向,讲述开源向善(Open Source for Good)的主题。</p><p><img src="/img/remote/1460000037569893" alt="" title=""></p><p><strong>朱凯将在 10 月 25 日的数据技术分会场,进行主题演讲《从 ClickHouse 的名字来历说起》,与广大开发者分享 ClickHouse 的历史与发展、核心功能以及应用场景等。</strong></p><p>你可以通过<strong>访问以下链接</strong>,或点击<strong>阅读原文</strong>进行报名。活动火热进行中,期待你的参与!</p><p><strong>报名链接或点击原文阅读:</strong><strong><em><a href="https://link.segmentfault.com/?enc=%2FV7z2VUEfDR2P%2F4b1356Gg%3D%3D.NhCC1NCaUBRMcs54bHdDiOWCs%2B0OsNlCa%2Ft%2FE%2BZFhE21q%2BCchjnWAHDargvduU3o" rel="nofollow">https://www.bagevent.com/even...</a></em></strong></p><p><strong>线上直播链接:</strong><a href="https://segmentfault.com/area/coscon-2020">https://segmentfault.com/area...</a></p>拒绝「扼脖子」,Zilliz 打造国产开源基础软件样板https://segmentfault.com/a/11900000375697612020-10-22T18:03:50+08:002020-10-22T18:03:50+08:00思否编辑部https://segmentfault.com/u/writers7<blockquote><strong>内容概要:</strong>2020 年中美贸易摩擦频发,美国对中国的制裁从实物蔓延到了技术领域,降低对国外基础软件的依赖、寻求科技自主的风气盛行,国产基础软件从幕后走到台前,开始发力。<p><strong>关键词:</strong>中美摩擦 科技制裁 基础软件</p><p>作者:<a href="https://segmentfault.com/u/chaoshenjinghyperai"><strong>@超神经HyperAI</strong></a></p></blockquote><p>2020 年 6 月初,随着中美贸易摩擦的加剧,工科神器 MATLAB 数模软件在国内 13 所高校内被禁用。随后又一基础软件、化学神器 ChemOffice 开始严查盗版,一时间国内科研圈人心惶惶。</p><p>除学术领域外,产业中从云基础架构到数据库再到操作系统等,对国外基础软件也存在相当广泛的依赖。基础软件被禁用为国内企业敲响了警钟,要想不被「扼脖子」,<strong>就要科技自主,创建国产的基础软件。</strong></p><p>实际上国内早有企业在研发基础软件,Zilliz 就是其中的一个代表。<strong>今天我们有幸邀请到了 Zilliz 合伙人、首席架构师顾钧,</strong>和他一起聊聊开源的故事。</p><h2><strong>从北大到 LF AI,深耕数据服务 16 年</strong></h2><p>2004 年顾钧从北大计算机科学专业毕业,成为工商银行的生产系统数据库管理员,<strong>这开启了顾钧与数据库服务的不解之缘</strong><strong>。</strong>此后他又先后在 IBM、摩根士丹利、华为等企业任职,负责过多家银行的数据中心、核心数据库维护及优化等业务。</p><p>据网上数据统计,银行非常受北大毕业生的偏爱,众多北大学生把银行作为毕业后的理想归宿。<strong>同是北大毕业生、同样有丰富银行数据库管理经验的顾钧,却偏要逆行。</strong></p><p>2019 年 6 月,<strong>顾钧以合伙人和首席架构师的身份加入开源基础软件公司 Zilliz,负责公司的开源基础软件、向量搜索引擎 Milvus。</strong></p><p><img src="http://mmbiz.qpic.cn/mmbiz_jpg/QkCvnz083AgBNbUh6VFGCIwFYWdZr7DUwyCtg2ibhQRQhvSITRaeL17icF4fYFrn8RrUZomIpWFZxhMT0RUvtAvw/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1" alt="" title=""></p><p><em>顾钧在 GAIR 2020 的 AI 源创专场进行分享</em></p><p>工作内容的变化为顾钧接触开源基金会提供了契机,<strong>2019 年 12 月,顾钧成为 LF AI 技术咨询委员会的投票成员,</strong>在代表 Milvus、帮助 Milvus 成长的同时,帮助 LF AI 扩大外部的影响力。</p><p><strong>LF AI 全称 Linux Foundation AI Foundation,是 Linux 基金会旗下面向 AI 领域的顶级基金会,</strong>致力于创建可持续发展的开源 AI 生态系统,借助开源技术轻松创建 AI 产品和服务。</p><p><img src="http://mmbiz.qpic.cn/mmbiz_jpg/QkCvnz083AiaQUINERLxH71YzaDLpjUIVkJeJAMUojj7Tibar3eWngfIBljgHU5jumKLwgHNO6PlZW1u3uoM3kiaw/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1" alt="" title=""></p><p><em>LF AI 成员企业列表丨Zilliz 与 AT&T、华为等大厂均属于高级会员</em></p><p>以这种方式加入到开源事业中,在数据库工程师出身的顾钧看来,<strong>是「始料未及」的。</strong></p><h2><strong>把开源写进基因的基础软件公司</strong></h2><p><strong>顾钧所加入的 Zilliz 专注于开发面向 AI 和 IoT 时代的数据科学软件。</strong></p><p>在数据科学、AI 等领域,开源本就是一个非常常见的做法。同时,在研发内部项目的过程中,Zilliz 也大量受惠于其他开源项目,因此 Zilliz 拥抱开源理念、融入开源社区,这在顾钧看来是一件「自然而然的事情」。</p><p><img src="http://mmbiz.qpic.cn/mmbiz_jpg/QkCvnz083AgBNbUh6VFGCIwFYWdZr7DUCQvJ1lURYiaYKibfFpXxkYWZibZEVjf2VhptyRjbNrLPA1rWgvicZDLFPQ/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1" alt="" title=""></p><p><em>顾钧与 Zilliz 部分团队成员合照丨二排左四为顾钧本人</em></p><p>确定了公司的开源战略后,Zilliz 进行了一系列尝试和努力。</p><p>2019 年 12 月 17 日,<strong>Zilliz 正式成为 LF AI 基金会的高级成员。</strong></p><p>2020 年 1 月 16 日(受新冠疫情影响,LF AI 审批流程延期至 4 月初),经 LF AI 技术委员会投票决定,<strong>特征向量相似度搜索引擎 Milvus 正式成为 LF AI 基金会的孵化项目。</strong></p><p>4 月 22 日, <strong>Zilliz 创始人兼 CEO 星爵当选 LF AI (The Linux Foundation AI 基金会)新一届理事会主席,</strong><strong>这是中国代表首次担任国际顶级开源 AI 社区的最高职务。</strong></p><p><img src="/img/bVcHNLk" alt="image.png" title="image.png"></p><p><em>LF AI 部分现任理事会成员丨左一为 理事会主席、Zilliz CEO 星爵</em></p><p>在公司内部大家常常打趣道,<strong>Zilliz 为国际开源事业算是做到了出项目、出钱、出人、又出 CEO。</strong></p><p>在谈及 Zilliz 后续在开源领域的愿景和规划时,顾钧坦言,Zillliz 是一家开源基础软件公司,我们相信开源是验证需求与拓展开发者的最优解。公司接下来的研发方向依然会围绕数据科学领域布局全球,<strong>让世界看到中国的开源项目也能做到国际一流,帮助提升中国公司在全球开源圈的影响力。</strong></p><h2><strong>首个国产 AI 数据平台向全世界开源</strong></h2><p>Zilliz 将开源提升到战略层面后,<strong>打头阵开源的产品就是基础软件 Milvus。</strong></p><p>据 IDC 预测,2018 年到 2025 年之间,全球产生的数据量将会从 33 ZB 增长到 175 ZB,<strong>其中超过 80% 的数据都会是处理难度较大的非结构化数据。</strong>如何快速高效地处理大规模非结构化数据,成为企业健康发展的关键。</p><p>为此,Zilliz 推出了向量搜索引擎 Milvus,从而方便用户对特征向量进行计算和检索,加快非结构化数据的处理进程。</p><p><img src="http://mmbiz.qpic.cn/mmbiz_png/QkCvnz083AgBNbUh6VFGCIwFYWdZr7DULlq7Q6k3AR2ibm43Kkz1r3Kp1icAGmDG6pYgfbrEXpNCDT3OdqQhWR1Q/640?wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1" alt="" title=""><br><em>官方公布的 Milvus 整体架构示意图丨确定 Milvus 的开源路线后,顾钧和团队做了两项准备工作。</em></p><p><strong>首先他们按照开源的惯例与要求对 Milvus 的源码和文档进行了梳理。接下来他们为 Milvus 寻找合适的国际一流的开源基金会。</strong></p><p>在顾钧看来,<strong>只有项目自身和外部环境都准备就绪,</strong>才有机会让全球开发者了解 Milvus、使用 Milvus,甚至为 Milvus 项目做出贡献。</p><p><strong>2019 年 10 月,Milvus 正式在 GitHub 开源。</strong>在其开源的 7 个月内,Milvus 就吸引了超过 300 家企业级用户,甲子光年曾这样形容 Milvus 开源后的成绩:<strong>即使是在没有付费门槛的开源市场,这个速度依然惊人——目前成立五年、已是中国开源项目样本的新型分布式数据库公司 PingCAP 积累前几百家企业用户用时为两年半。</strong></p><p>截止到今年 4 月,Milvus 的下载量已超过 20k,<strong>外部贡献者数量约为内部贡献者人数的 4 倍。</strong></p><p><img src="http://mmbiz.qpic.cn/mmbiz_png/QkCvnz083AgBNbUh6VFGCIwFYWdZr7DUdoG9X6R8bZFcIXzDPVKZxje7ebIVjtHU4iaSzDSuz9MdfibDYPVOzSCg/640?wx_fmt=png&wxfrom=5&wx_lazy=1&wx_co=1" alt="" title=""></p><p><strong><em>贝壳找房、WPS智能写作平台均为Milvus的用户</em></strong></p><p>能取得这些喜人的成绩,在 Milvus 开源负责人顾钧看来,主要得益于团队<strong>明确自身能为受众带来的价值,<strong><em><em>并且量体裁衣,</em></em></strong>针对开发者和 B 端用户分别采用了不同的引导方式。</strong></p><p>一个国产软件,能够进入国际一流的开源基金会,做出在国际市场上首屈一指的优秀开源项目;在拥有行业领先的核心技术时,有勇气有信心向全世界开发者公开自己的源码,Zilliz 的高瞻远瞩的全球发展战略令人钦佩。</p><h2>看开源年会,听顾钧分享 Milvus 的故事</h2><p><strong>业内最具影响力的开源年度盛会 2020 中国开源年会(COSCon'20)将于 10 月 24-25 日召开。</strong>今年的嘉宾分享将采取线上线下相结合的形式,从人工智能、开源治理、数据技术、教育与公益等 11 个方向,讲述开源向善(Open Source for Good)的主题。</p><p><img src="http://mmbiz.qpic.cn/mmbiz_jpg/QkCvnz083AgBNbUh6VFGCIwFYWdZr7DUPId0Me91sX2lepkjib2Wmbukl67qkO2HdXziaCvr6g1SF1l9iapiane2zw/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1" alt="" title=""></p><p><strong>10 月 25 日 16:50-17:30,顾钧将在 COSCon'20 人工智能分会场带来题为《Milvus:构建非结构化数据服务》的分享。</strong></p><p>你可以通过<strong>访问以下链接</strong>,或点击<strong>阅读原文</strong>进行报名。活动火热进行中,期待你的参与!</p><p><strong>报名链接或点击原文阅读:</strong><a href="https://link.segmentfault.com/?enc=DJe2xnm0K4LsOmjWrLXtMw%3D%3D.bwb6EY9d%2FwXcuBPvqCVVDYCW4%2FoD1ufDV09OkbSBptYeTZGtVZK5hAOhWKr8gQbu" rel="nofollow">https://www.bagevent.com/even...</a></p><p><strong>线上直播链接:</strong><a href="https://segmentfault.com/area/coscon-2020">https://segmentfault.com/area...</a></p>发起 Wuhan 2020,他是高校开源创新首批「吃螃蟹的人」https://segmentfault.com/a/11900000375694572020-10-22T17:41:22+08:002020-10-22T17:41:22+08:00思否编辑部https://segmentfault.com/u/writers7<blockquote><strong>内容概要:</strong>2020 年年初的新冠疫情席卷全国多地,为支援疫情重灾区武汉,一批来自五湖四海的人,自发集结起来,以开源的形式贡献力量。<p><strong>关键词:</strong>开源教育 Wuhan2020 COSCon'20<br><strong>作者:</strong><a href="https://segmentfault.com/u/chaoshenjinghyperai">@超神经HyperAI</a></p></blockquote><hr><p>年初,新冠肺炎席卷全国多个城市,武汉作为国内首个感染者集中爆发的城市,牵动着全国人民的心。</p><p>1 月 23 日,农历腊月二十九,除夕的前一天,为了加强疫情防控,控制病毒传播,武汉做出了「封城」的决定,整个城市忽的一下被按下了暂停键,对疫情的惶恐冲淡了春节的喜乐祥和。</p><p>同样紧张忧虑的,还有当时身处上海的华东师范大学的教师王伟。他将这种惶惑不安化为力量和智慧,凭借技术的力量,亲身经历了这场魔幻的疫情阻击战。</p><h2>Wuhan2020:前疫情时代的本土开源社区</h2><p>技术,能为疫情中的武汉做些什么?同为教师和科技从业者的王伟,也在思考这个问题。</p><p>信息不对称导致资源浪费和流通效率低,是当时的主要矛盾,<strong>能否做一个信息平台,对接物资的供给方和需求方,让真实性信息在平台上流转起来呢?</strong></p><p>1月25日,王伟老师在学生赵生宇的提议下,发布了一篇公众号文章,<strong>号召大家通过开源的方式来抗击疫情。</strong></p><p><img src="/img/remote/1460000037569460" alt="" title=""><br><strong><em>Wuhan2020 项目的第一篇招募文章发布</em></strong></p><p>这篇文章经由众多社区和朋友转载后成功出圈儿,吸引了来自五湖四海、各行各业的社会人士加入,<strong>高峰时期项目志愿者超过 4000 人。</strong></p><p>社区成立 8 个多月以来,在疫情地图、辟谣、对接供需方面,都发挥了重要的作用,开发、设计、文案……<strong>都是依赖志愿者线上沟通、远程协作完成的。</strong></p><p>如今疫情告一段落,<strong>当我们问及 Wuhan2020 沉淀的经验和启发时,</strong>王伟老师坦言这是他和核心成员第一次组织如此大规模、线上的开源社区,大家获得了极大成就感,但是也暴露出一些问题。</p><p><img src="/img/remote/1460000037569461" alt="" title=""><br><strong><em>Wuhan2020 GitHub 项目一览,目前 Star 人数已超过 6.3k</em></strong><br><strong><em><em>项目地址:<a href="https://link.segmentfault.com/?enc=SC4XUUCvmvbvuE2fhtChmg%3D%3D.X8vjepKUGNnAXBdwdRnpNk%2BcVj7zi93Y46vHdN4LL%2Fs%3D" rel="nofollow">https://github.com/wuhan2020</a></em></em></strong></p><p>维护社区过程中沉淀下来的工作流程和开源工具,是一笔宝贵的财富,但是社区人员在开源素养和能力方面还有很大的提升空间。</p><p>如何评估一个开源社区的发展状况,王伟老师也跟我们分享了他在 Wuhan2020 中总结出来的经验。</p><p><strong>第一制定开源健康指标,</strong>量化开源社区的运营状况,比如项目排名、活跃度、贡献者多样性等等;<strong>第二针对健康指标评分,给出解决方案。</strong></p><p>国外很多学校和基金会都在做这件事情,比如著名的 Apache 基金会,<strong>相比于国外,国内开源现状还略显稚嫩。</strong></p><h2>建立国内开源氛围,需要更多实干家</h2><p><strong>除了「教师」这重身份外,王伟老师在业界也非常活跃。</strong></p><p><strong>开源社执行长、X-lab 开放实验室创始人、国内首个开源教育基金倡导者、2020 中国开源杰出贡献人物……</strong>这些标签像一个个被轻轻按下的 button,开启了一扇又一扇国内开源热潮的大门,让王伟老师对国内开源现状有了更深刻的认识。</p><p><img src="/img/remote/1460000037569463" alt="" title=""><br><strong><em>王伟老师入选 2020 中国开源杰出贡献人物并发表感言</em></strong></p><p><strong>在王伟老师看来,开源在国内起步晚,加之缺乏必要的经验和支持,因此发展尚不成体系。</strong></p><p>我们从网上得知,王伟老师在校期间曾参与多个产学结合的开源项目,<strong>合作企业既包括阿里、华为等国内大厂,也有 IBM、微软等外企。</strong></p><p>那么国内外企业在对待开源项目上有何区别?这种差异是如何产生的?王伟老师结合自身感悟,给出了他的答案。</p><p>他认为,<strong>国内大厂的开源项目主要靠自我推广,</strong>比如企业内部去外面做宣传、举办 meetup 等,更新迭代主要依赖内部员工。</p><p>而国外大厂则正好相反,很多优质开源项目中,<strong>公司以外的贡献者远超内部员工,</strong>如此一来公司付出的开发和维护成本随之降低,产出远高于投入,激励企业开源更多项目,形成良性循环。</p><p><img src="/img/remote/1460000037569462" alt="" title=""><br><strong><em>谷歌至今开源项目数量已超过 2000</em></strong><br><strong><em>数据来源于 <a href="https://link.segmentfault.com/?enc=1m%2FUC6z5GJmyJGxsUEzDUQ%3D%3D.DCn6TmPtA7LbUCY8bo9MTUzl5Zc9IO4Ub7fCmOGWL8k%3D" rel="nofollow">https://opensource.google</a></em></strong></p><p>而出现这种差异的主要原因,<strong>王伟老师认为有一部分原因是,</strong><strong>国内开源基金会和企业都尚未准备好。</strong></p><p>这导致开源治理只能由各个大厂自己负责,但是各大厂在这件事上并非「行家」,<strong>不仅缺乏开源贡献者,更缺懂开源治理背后体系的专业人士。</strong></p><p>加上业务压力大,开源项目创收不足,因此企业投入到开源的精力也有限,这也导致开源仅停留在「生态构建需求」上,一直没被提升到战略级别。</p><p>而国内企业如果真想利用好开源,依王伟老师看离不开三点:<strong>盈利能力是前提、领导者重视是基础、耐心和恒心是关键。</strong></p><p>只有贯彻好这些准则,才能不断加大自身对开源的贡献,提高自己在开源国际上的影响力。</p><h2>越过重洋,才知道校园更需要什么</h2><p><strong>在美国 Wisconsin 大学 Madison 分校和美国 Florida 大学的访学经历,</strong>让同为教育者的王伟老师深有感触。</p><p><strong>国外高校对于开源教育十分重视,会为此开设学科和具体的课程;</strong>可是当我们回望开源教育在国内高校的发展时,往往会发现一片广袤的荒芜,计算机及人工智能相关专业的蓬勃,轻轻撬动了「开源」这块冻土的一角,但这远远不够。</p><p><img src="/img/remote/1460000037569465" alt="" title=""><br><strong><em>2015 年王伟老师在 Florida 访学期间拍照</em></strong></p><p><strong>这主要是因为中外高等教育体制的迥异。</strong>首先与开源贡献比起来,国内更重视论文发表和获奖,评估体系的差异导致国内师生缺乏为开源付出的动力。</p><p><strong>其次则是产学结合的程度不同。</strong>美国高校和企业联系密切,因此促进了企业开源项目在学校内的传播和发展;国内企业和高校则比较割裂和脱节,绝大部分的开源项目还是在商业公司里。</p><p>回国后的王伟老师把自己这些思考带到了工作中,校内开源资源少,他就鼓励学生们「走出去」,去投身业内的开源社区、积极参与大厂定期举办的活动和竞赛,帮助同学们拓宽接触开源的途径。</p><p>2019-2020 学年第一学期,王伟还联合国内多个大厂和开源社区,包括开源布道师,<strong>在华东师范大学开设了首门深度开源实践课程《开源软件设计与开发》。</strong></p><p><img src="/img/remote/1460000037569464" alt="" title=""><br><strong><em>《开源软件设计与开发》的理论授课内容</em></strong></p><p><strong>王伟老师把学校视为「开展开源教育很好的试验田」,</strong>这块试验田给了他和同学们共同探索的平台,在课程的不断迭代中,王伟老师也得以因地制宜地打造更适合中国学生的开源教育。</p><p>而学校和王伟老师的这些努力,可以帮助同学们接触到最先进的技术,最先进的理念,以及遇到最优秀的志同道合的一些人,提升同学们的「个人素养和协作精神」。</p><h2>COSCon'20 报名进行中,王伟老师在等你</h2><p><strong>业内最具影响力的开源年度盛会 2020 中国开源年会(COSCon'20)将于 10 月 24-25 日召开。</strong>今年的嘉宾分享将采取线上线下相结合的形式,从人工智能、开源治理、数据技术、教育与公益等 11 个方向,讲述开源向善(Open Source for Good)的主题。</p><p><img src="/img/remote/1460000037569466" alt="" title=""></p><p><strong>王伟老师不仅担任了教育与公益分会场的出品人,也会在大会进行主题演讲,并发布<strong><em><em>《2020中国开源年度报告(预览版)》</em></em></strong>。</strong></p><p>你可以通过<strong>访问以下链接</strong>进行报名或观看直播。活动火热进行中,期待你的参与!</p><p><strong>报名链接:</strong><a href="https://link.segmentfault.com/?enc=Do8Jl0PM3GtnFNm4FBH5FQ%3D%3D.OpKX9kxhaHU3oq5eNfCMwC0NtqK16DUJbr%2BuhNWlBk1iLBSK07ZHeGhDaJyjJVOk" rel="nofollow">https://www.bagevent.com/even...</a><br><strong>线上直播链接:</strong><a href="https://segmentfault.com/area/coscon-2020">https://segmentfault.com/area...</a></p>ASF 孵化器导师姜宁:开源不是简单的代码开放,是依托项目构建一个共同体https://segmentfault.com/a/11900000375563672020-10-21T18:22:11+08:002020-10-21T18:22:11+08:00思否编辑部https://segmentfault.com/u/writers6<blockquote>一个人走的很快,但是一群人能走得更远。<strong>通过开放协作我们可以做到很多时候一个人想都不敢想的事情。</strong><br>—— ASF Member,ASF 孵化器导师姜宁</blockquote><hr><p>2020 中国开源年会 (COSCon'20) 将于 10月24-25日由开源社举办,SegmentFault 思否社区为本次大会的战略合作媒体,并将进行独家的线上直播。</p><p>本次年会将采取线上线下相结合的形式,<strong>北京、上海、深圳、成都、长沙五城联动</strong>,11 个分会场,线上线下同时进行。</p><p>为了让大家进一步了解开源、了解本次 COSCon’20,SegmentFault 思否特别采访了 <strong>Apache Member、ALC Beijing 发起人 —— 姜宁</strong>。</p><blockquote><p>姜宁老师是华为开源软件中心技术专家,前红帽软件首席软件工程师,有十五年以上企业级开源中间件开发经验,有丰富的 Java 开发和使用经验,函数式编程爱好者。</p><p>从 2006 年开始一直从事 Apache软件基金会 (ASF) 开源中间件项目的开发工作,先后参与 Apache CXF, Apache Camel,Apache ServiceMix,以及 Apache ServiceComb 的开发。2015 年开始担任 ASF 孵化器导师,参与孵化了 Apache Rocket,Apache Skywalking,Apache ShardingSphere, Apache IoTDB,Apache Doris(Incubating),Apache APISIX,Apache Weex(Incubating)。 </p><p>作为长期活跃于开源社区和开发者社区的一名开源布道师,在本次的开源年会中,姜宁将以特邀主持人的身份主持<strong>《开源治理分会场》</strong>,并出席同期于北京举办的开源线下聚会活动。</p></blockquote><p><img src="/img/bVcHPjP" alt="image" title="image"></p><p>以下为 SegmentFault 思否对姜宁的访谈内容:</p><hr><p><em><strong>1、网上有很多关于您的介绍,您一般倾向于如何介绍自己?</strong></em></p><p>因为我现在的主要工作帮助大家理解开放式协作是什么,如何围绕开源项目构建社区,我更喜欢的还是 ASF 孵化器导师这个 title。</p><hr><p><em><strong>2、能否谈一下您对开源的理解?您认为开源的核心和精髓是什么?</strong></em></p><p>我觉得开源不是简单的代码开放,而是依托开源项目构建起了一个共同成长发展的共同体(community),大家可以依托这个共同体完成了一个人无法完成的事业。</p><p>开源的核心是开放和协作,开放意味着大家获取开源项目相关的信息成本很低,可以跨越公司和组织的边界获取项目的信息;这样带来的好处是大家可以基于这些开放的信息来进行协作,开源项目的生产者和消费者可以平等的沟通,高效的协作。</p><p>开源的精髓是公开透明。应该是通过开放的代码可以让一群分布在世界各地的人们能够自发的进行高效协作,并且按照一定规则共享协作成果。</p><hr><p><em><strong>3、能否分享一下您对开源社区的理解和看法?您认为开源社区最大的价值是什么?</strong></em></p><p>开源社区最大的价值是把开源项目的消费者和生产者联系在一起形成了一个利益共同体。依托于这个共同体,开源项目的生产者和消费者可以在一个公开平等的环境下项目协作,开源项目可以不断得到用户的有效反馈快速完善。</p><p>在这里新手可以获得免费的指导与开源项目一同成长,而开源社区的导师机制可以保证与开源项目相关的知识能够得到有效的传承,最后开源社区的归属感也不断推动着社区成员不计报酬的为社区做出贡献。</p><hr><p><strong>4、您认为现阶段是什么阻碍了更多的企业和开发者拥抱开源?</strong></p><p>我觉得还是因为我们不了解开源,很多时候我们都是站在开源消费者(搭便车)的角度来看待开源,使用开源软件。大家会觉得我用开源就好了,如果让我投身开源,为开源项目做贡献的话是没有什么商业收益的。</p><p>很多时候大家自己基于开源软件所做的修改不愿意回馈到上游社区导致后续开源项目的隐性维护成本急剧升高,也是阻碍企业和开发者拥抱开源的一个很重要原因。</p><hr><p><em><strong>5、您认为开源对于企业最大的意义与价值是什么?什么样的企业适合拥抱开源文化?</strong></em></p><p>我觉得开源对于企业来说最大的意义是开放式创新,依托开源项目企业可以联合客户一同协作解决实际问题,并且共享成果。</p><p><strong>我一直认为好的软件是用出来的,不是一开始就设计出来的</strong>,通过开源可以充分调动客户的参与度,降低软件开发的试错成本,让我们开发的软件能够在比较短的时间内就能快速成熟。</p><p>互联网企业拥抱开源文化会比较快一些,现在越来越多的大厂也关注到了开源带来的效益,开始将开源的开发方式引入到公司的内部项目开发。</p><hr><p><em><strong>6、开源文化具备很多核心价值,是否有哪些可以引用延伸至其他领域?</strong></em></p><p>我理解的开源文化的核心价值包含了开放透明,精英之治 Meritocracy,协作。开放降低了大家获取信息的成本,让我们可以跨越时空进行交流。</p><p><strong>Meritocracy 将权力交给实际干活的人,让有才能的人展现出来,让好的点子脱颖而出,真正做到才配其位。</strong>协作让大家跨越各种边界为了共同的目标聚到一起协同解决同样的问题。</p><p>开源的开放协作文化可以让来自于不同公司,有着不同背景的人坐在一起一同解决大家关心的问题。除了我们可以在一起开发软件,我们也可以在一起制定标准,或者是一起写一本书,创作一个故事。</p><p>一个人走的很快,但是一群人能走得更远。通过开放协作我们可以做到很多时候一个人想都不敢想的事情。</p><hr><p><img src="/img/remote/1460000037556271" alt="" title=""></p><p><img src="/img/remote/1460000037556371" alt="" title=""></p><p>开源年会作为国内最具影响力的开源爱好者聚会品牌,今年大会的主题是 <strong>「开源向善」</strong>,由来自于国内外领头羊的开源基金会和企业领袖,和观众分享开源运动与开源技术的最新发展和开源向善的本质与实践是如何改变了世界。</p><p>对 COSCon'20 内容感兴趣的你,可以通过下方的链接或点击阅读原文进行报名,期待你的参与!除了在线上观看直播外,本次峰会将在<strong>北京、上海、深圳、成都、长沙</strong>五城展开线下聚会,审核通过后即可免费报名参加~</p><blockquote><p>会议报名链接:<br><a href="https://link.segmentfault.com/?enc=riAmwj9kMA1SsoI47tOKJQ%3D%3D.4hbtlzbbx0KGuITZFTWeg7Tz%2FNDc4NmravdvFP5ZB0WwqUS%2BoRtYo82NPNCN6Dm8" rel="nofollow">https://www.bagevent.com/even...</a></p><p>线上直播链接:<br><a href="https://segmentfault.com/area/coscon-2020">https://segmentfault.com/area...</a></p></blockquote><p><img src="https://segmentfault.com/img/bVbMd4g" alt="segmentfault 公众号" title="segmentfault 公众号"></p>开源社理事长庄表伟:国内开源技术和产品就像“在土壤中生长的农作物”,现状远称不上良好https://segmentfault.com/a/11900000375563362020-10-21T18:19:08+08:002020-10-21T18:19:08+08:00思否编辑部https://segmentfault.com/u/writers6<blockquote>现在国内的开源土壤气候环境,还存在各种问题,我们得想办法不断改进。更加需要改进的,是我们的开源教育,引导培养更多的新人,热爱开源,投身开源。<br>——开源社理事长:庄表伟</blockquote><hr><p>2020 中国开源年会 (COSCon'20) 将于 10月24-25日由开源社举办,SegmentFault 思否社区为本次大会的战略合作媒体,并将进行独家的线上直播。</p><p>本次年会将采取线上线下相结合的形式,<strong>北京、上海、深圳、成都、长沙五城联动</strong>,11 个分会场,线上线下同时进行。</p><p>为了让大家进一步了解开源、了解本次 COSCon’20,SegmentFault 思否特别采访了开源社理事长 —— 庄表伟。</p><blockquote>庄表伟是<strong>华为云 DevCloud 高级产品经理</strong>、<strong>华为内源社区架构师</strong>、<strong>华为云代码托管服务产品经理</strong>,同时也是<strong>开源社理事、执行长</strong>,曾著有:《开源思索集》一书。<p>作为长期活跃于开源社区和开发者社区的一名开源布道师,在本次的开源年会中,庄表伟老师将以<strong>《开源治理与数字化转型》</strong>为主题进行分享。</p></blockquote><p><img src="/img/bVcHPjZ" alt="image" title="image"><br>以下为 SegmentFault 思否对庄表伟老师的访谈内容:</p><hr><p><em><strong>1、网上有很多关于您的介绍,您一般倾向于如何介绍自己?</strong></em></p><p>我比较喜欢自称为架构师 + 产品经理。在自己的职业生涯中,我做过不少技术架构的设计,也做过不少的产品设计。现在越来越感觉到:<strong>无论是技术架构还是产品,要想做出好的设计,背后的很多原则其实是相通的。</strong></p><p>架构,不仅仅是技术架构,也包括业务架构,商业架构。产品,不仅仅是一套具体的软件产品,也包括我们打算呈现给目标对象的一整套形象。比如说一个开源社区,你也可以从架构师的角度去思考,社区如何组织架构。也可以从产品经理的角度思考,如何运营打磨。</p><p>这些思考,都非常有意思。</p><hr><p><em><strong>2、能否谈一下您对开源的理解?您认为开源的核心和精髓是什么?</strong></em></p><p>我理解的开源,是一套方法论。作为一场席卷全球的世界性运动,20 多年来的历史证明,开源不仅仅能够孕育最新的技术、创造更好的软件,更能够帮助这个世界变得更好。剖析开源的内涵,理解开源的精神,能够让我们理解,为何开源能够让世界变得更好。在我看来,开源的精神体现在这几个方面:</p><p><strong>- 分享</strong></p><p><strong>- 开放</strong></p><p><strong>- 平等</strong></p><p><strong>- 协作</strong></p><p><strong>- 创造美好世界</strong></p><p>乐于分享是一切善举的开端;公开透明是一切良好协作的基石;对于平等的追求是社区健康的保障;开放式协作,逐步凝聚共识是社区繁荣的秘诀;创造更加美好的世界,是开源的终极追求。</p><p>面对一个急速变幻、急速下坠、甚至可能变得撕裂的世界,我们更应该推广开源的精神,凝聚众人向善之力,汇聚众人向善之智,开放协作、互惠共赢,为这个世界变得更好,做出贡献!</p><p>最近我写了一篇宣言,总结了开源的分享、开放、平等、协作,然后在此基础上,创造美好世界的基础逻辑。可以供大家参考。</p><blockquote>《开源人宣言》链接:<p><a href="https://link.segmentfault.com/?enc=C7N%2Fv99vFxG2eaQ%2FdEopbA%3D%3D.gExL34N6gXh%2BRhep%2Bo7ULOXkka%2FuqRyZZZTclExNtPTEoxEqDPh5Qij0WDHkyZDEKbomODXX9wrAlEXc6sjkqw%3D%3D" rel="nofollow">https://github.com/kaiyuanshe...</a></p></blockquote><hr><p><em><strong>3、能否分享一下您对国内开源技术和产品的看法?</strong></em></p><p>正好之前和朋友讨论过这个话题,我的看法是:<strong>应该将国内的开源技术和产品,看成某种“在土壤中生长的农作物”。</strong></p><p>我们当然希望这些庄稼长势良好,但是现状是:远远称不上良好。我们对于自己的定位,应该是农业的工程师,不仅仅要埋头苦干,更不能拔苗助长。需要深入的研究土壤、水文、阳光、气温、肥力等等诸多因素,然后考虑如何逐步改进。还需要选种、育种,培养一代又一代更加优良的农作物,使得咱们的庄稼,越长越好。</p><p>换成行内术语就是:现在国内的开源土壤气候环境,还存在各种问题,我们得想办法不断改进。更加需要改进的,是我们的开源教育,引导培养更多的新人,热爱开源,投身开源。</p><hr><p><em><strong>4、几年前,您对“想要进入开源领域的开发者”的建议是“慎入”,那现在呢?这个开源领域对于新手还是那么的“危险”么?为什么?</strong></em></p><p>依然是慎入,因为开源不是伊甸园,不是乌托邦。投入巨大热情,也可能会换来失望。如果无法坚持,还会反过来说:“我忽悠他们”。那我还是不忽悠,把难题讲得清楚些。</p><p><strong>投入开源最大的危险,还是因为缺乏足够的时间,导致三天打鱼、两天晒网。</strong>几年前我提出慎入的时候,还没有996这个说法呢。现在,只会更难。</p><hr><p><em><strong>5、您在具体的开源过程中遇到的最大的挑战是什么?</strong></em></p><p>无法合理的分配自己的时间,导致曾经的承诺无法兑现,很多自己想做的开源项目,也没有坚持下去。说实话,开源不是那种特别困难,特别挑战的任务。关键是,愿意花时间投入。</p><hr><p><em><strong>6、华为内部开源治理有哪些比较普适的经验或者方法可以分享?</strong></em></p><p>正好本次COSCon 2020,我会有一场演讲《开源治理与数字化转型》,我对于这个方面也有一些自己的思考,想分享给大家。主要就是我从开源治理实践中,总结出来的一些方法论,欢迎大家收看大会的直播(直播链接见文末),也欢迎在社区里找我们讨论。</p><hr><p><em><strong>7、开源社区应该如何协调与商业之间的关系?</strong></em></p><p>面对这个问题,我脑子里冒出来的第一个词是“无欲则刚”,哈哈。本质上,开源社区对于商业,平视即可。<strong>不必蔑视,不必仰视,不必唾弃,也不必依赖。</strong>平常心对待即可。另一方面,多学一点法律相关的内容,知识产权保护方面的内容,会有帮助。</p><hr><p><em><strong>8、您认为影响开源项目成败最关键的因素是什么?为什么?</strong></em></p><p>Apache 社区的理念是社区大于代码(Community Over Code),但是在我看来,Code 是一串数字中的那个 1,Community 是 1 后面的那些 0。</p><p>我们不能简单的认为:社区比代码更重要,而是一个开源项目先得有代码,再在此基础上,培育健康的社区。到了某种良性循环的阶段,健康的社区能帮助代码发展得更好,那就妥当了。单纯强调其中一个因素,可能会有偏废。</p><hr><p><img src="/img/bVcHMj2" alt="image" title="image"></p><p>中国开源年会作为国内最具影响力的开源爱好者聚会品牌,今年大会的主题是 <strong>「开源向善」</strong>,由来自于国内外领头羊的开源基金会和企业领袖,和观众分享开源运动与开源技术的最新发展和开源向善的本质与实践是如何改变了世界。</p><p>对 COSCon'20 内容感兴趣的你,可以通过下方的链接或点击阅读原文进行报名,期待你的参与!除了在线上观看直播外,本次峰会将在<strong>北京、上海、深圳、成都、长沙</strong>五城展开线下聚会,审核通过后即可免费报名参加~</p><blockquote>会议报名链接:<p><a href="https://link.segmentfault.com/?enc=JBjA9HwI0ySBiArBwjezaQ%3D%3D.Xq4bFlsbK6j5JLjOVvMqYOQczZN2%2B0PHFC4lKzbPed6pfVhWXRDb%2Fy85CvIbSqqT" rel="nofollow">https://www.bagevent.com/even...</a></p><p>线上直播链接:</p><p><a href="https://segmentfault.com/area/coscon-2020">https://segmentfault.com/area...</a></p></blockquote><p><img src="https://segmentfault.com/img/bVbMd4g" alt="segmentfault 公众号" title="segmentfault 公众号"></p>易观大数据平台总监代立冬:拥抱开源可以避免重复造轮子,开发者需要抛弃“拿来主义”https://segmentfault.com/a/11900000375562682020-10-21T18:14:59+08:002020-10-21T18:14:59+08:00思否编辑部https://segmentfault.com/u/writers6<blockquote>特别希望国内的众多开发者对开源有更多的了解,抛弃”拿来主义“,积极拥抱开源、参与开源,为国内开源崛起贡献一份自己的力量。—— 易观大数据平台总监,Apache DolphinScheduler PPMC 代立冬</blockquote><hr><p>2020 中国开源年会 (COSCon'20) 将于 10月24-25日由开源社举办,SegmentFault 思否社区为本次大会的战略合作媒体,并将进行独家的线上直播。</p><p>本次年会将采取线上线下相结合的形式,<strong>北京、上海、深圳、成都、长沙五城联动</strong>,11 个分会场,线上线下同时进行。</p><p>为了让大家进一步了解开源、了解本次 COSCon’20,SegmentFault 思否特别采访了<strong>大数据分会场的出品人 —— 代立冬</strong>。</p><p>代立冬是易观大数据平台总监 & Apache DolphinScheduler PPMC,负责每日数百亿条数据处理链条的流程规划,技术选型,技术攻关及人才梯队建设等工作。专注于数据领域研发数据平台架构10年,擅长于数据平台建设、集群性能调优、数据仓库建设,曾任多家大数据公司数据架构师。</p><p><img src="/img/bVcHPoI" alt="image" title="image"></p><p>以下为对代立冬老师的访谈内容:</p><hr><p><em><strong>1、您认为开源对于开发者来说,最大的价值和意义是什么?</strong></em></p><p>1)可以不必再重复造轮子了,可以选择在开源项目的基础上做二次开发,开发者有更多的精力专注在自己想做的事情上;</p><p>2)对已经参与开源的开发者来说,开源社区高手众多,高手之间的碰撞会使得开发者的技术能力、沟通协作能力得到极大提升,尤其是沟通协作这种软实力对个人日后的职业成长十分有帮助;</p><p>3)开源已经成为技术实力的象征,有句话说得好 "talk is cheap, show me the code", 靠代码说话已经变得流行,很多技术岗位优先考虑开源社区的 Contributor 或者 Committer。</p><hr><p><em><strong>2、您认为什么样的开源项目算是优质的开源项目?有没有一些评判标准?</strong></em></p><p>借用 Apache 组织的一个重要观点 "社区 > 代码", 优质的项目是有足够多样性的社区的, 社区的繁荣程度决定这个项目能走多远,换句话说更看重人的能力,贡献者可能来自不同的公司,机构,使得项目能够长期发展。</p><hr><p><em><strong>3、能否分享一下您对国内开源技术和产品的看法?</strong></em></p><p>这 2 年国内的开源技术氛围得到了很大的改善,国内也建立有类似 Apache license 这种级别的木兰协议,最近国内也成立了开放原子开源基金会,这在过去都是很难想象的。随着开源氛围的逐渐变好,国内的开源技术实力也在迎头追赶国际顶尖水平,有些项目已经达到国际领先水平,但大部分项目还是很缺运作经验的,需要向国外如 Apache 这样的国际顶级组织学习。</p><hr><p><em><strong>4、您在具体开源的过程中遇到的最大的挑战是什么?</strong></em></p><p>我们在做大数据任务调度 - Apache DolphinScheduler 的过程中遇到过很多挑战,最大的挑战还是如何让这个新生的社区完成从 0 到 1 的过程。万事开头难,开源也不例外, 开源不是把代码开放出去就行了,还需要找到种子用户和开发者,可以说我们的第一批用户很多都是手把手教人部署,教人用起来,最终获得第一批用户的认可,这极大的增强了我们对项目的信心,随着用户越来越多,逐渐完成了从 0 到 1 的过程。</p><hr><p><em><strong>5、对于开源文化未来的发展,您有什么期待?</strong></em></p><p>特别希望国内的众多开发者对开源有更多的了解,抛弃开源是别人的事情,抛弃”拿来主义“,积极拥抱开源、参与开源,为国内开源崛起贡献一份自己的力量。</p><hr><p><em><strong>6、请向大家介绍一下今年的 COSCon'20 & Apache Roadshow 大会数据技术专场吧?</strong></em></p><p>随着数字化转型成为众多企业的共识,大数据量级的爆炸性增长和人们对数据的实时性的秒级响应要求,技术上如何应对是非常有意思的课题,本次特别邀请 12 位一线大咖分享干货,敬请期待!</p><hr><p><img src="/img/bVcHMnQ" alt="image" title="image"></p><p>移动互联网、物联网时代的到来,使得数据量级呈几何级爆炸性增长, 百亿级数据处理已经不新鲜,数据量猛增也对大数据处理链条的各个环节提出了新的要求和挑战,这态势也使得国内的大数据技术得以崭露头角,出现了不少由国人主导的国际性项目。</p><p>大数据前沿到底发生了哪些变化,数据技术专场特别邀请了 12 位一线大咖来分享国内外最前沿的先进技术和全球的开源现状及趋势。由于疫情原因,非常欢迎大家直播时多多交流,也欢迎为开源献上一份自己的力量。</p><p><strong>第一场 10月24日 13:30 开始</strong></p><p><strong>主持人</strong></p><p>缪翎,百度高级研发工程师 & Apache Doris PPMC, 负责 Apache Doris(Incubating) 设计研发工作。负责百度分布式数仓平台的设计开发,以及 Apache Doris 的开源推广工作。主要在数据分析,查询优化,开源等相关领域进行探索。</p><hr><p><strong>数据库化的分布式数据库中间件生态圈极简使用策略</strong></p><p><strong>潘娟,京东数科 - 高级DBA & Apache ShardingSphere PMC</strong></p><p>作为 Apache 顶级项目的 ShardingSphere,将会在最新发布版本中迈向从分布式数据库中间件生态圈到分布式数据库的转型。已在 GitHub 上收获 12k+ Star 的开源人气项目将进一步根据用户需求和应用场景,在这个数据库化的过程中全力打造更为简单、丰富、一体化、可插拔的分布式数据库产品体系,从而为用户提供最简单易用、功能强大、性能稳定的分布式数据库化产品。本次分享将为详细阐述数据库化的产品特性、架构体系、极简落地方案实践等核心内容。</p><hr><p><strong>通过 DataQL 在数据展现类项目中提升3倍人效</strong></p><p><strong>赵永春,DataQL - 项目发起人</strong></p><p>基于 DataQL 的数据聚合能力,为应用提供一个接口配置“界面”。使得使用者无需开发任何代码就能配置一个满足需求的接口。整个接口配置、测试、冒烟、发布。一站式都通过配套图形化 UI 界面完成。这种研发模式的变革使得,研发流程中对后端依赖大大降低从而提升近3倍人效。</p><hr><p><strong>开源、高效的物联网大数据平台</strong></p><p><strong>桑树多,涛思数据 - 应用架构师</strong></p><p>充分利用物联网数据的特点,针对通用大数据处理平台的挑战,涛思数据推出了一高性能、高可靠、可伸缩、零管理的物联网大数据平台TDengine,而且将核心代码,包括集群功能全部开源,获得全球开发者的高度关注,在GitHub上的star已经超过14K。本演讲将介绍TDengine的技术创新之处,包括存储引擎、计算引擎、流式计算、多维分析等等。</p><hr><p><strong>Apache Doris: 一款支持对海量数据进行快速分析的 MPP 数据库</strong></p><p><strong>陈明雨,百度 - 资深研发工程师 & Doris PPMC</strong></p><p>Apache Doris(Incubating)是一款支持对海量数据进行快速分析的 MPP 数据库。Doris 自设计之初,就秉承着极简运维、高效可靠、易学易用的原则,为用户提供全面而高效的海量数据分析能力。自 2018 年底进入 Apache 孵化器后,Doris 已经发布了 5 个大版本,接收了来自社区 100 多位开发者的贡献,并在多家互联网头部企业和垂直领域企业落地和应用。本次演讲主要包含 Doris 的发展历程、系统架构、主要特性和应用案例四个部分,帮助听众对 Doris 有一个全面而具象的认识。最后,陈明雨会介绍 Doris 社区目前的发展情况,希望能够帮助开发者更方便快捷的加入开源社区。</p><hr><p><strong>Github 2020全域分析报告</strong></p><p><strong>王皓月,华东师范大学 - 硕士研究生 </strong></p><p>在开源日益重要的今天,需要一份建立在全域大数据基础上的相对完整、可以反复进行推演的数据报告(报告、数据、算法均需开源)。GitHub分析报告是X-lab发起的GitHub开源分析报告项目,旨在通过分析Github全网的开发者行为日志,通过数据的视角,来观察全球范围内的开源现状、进展趋势、演化特征、以及未来挑战等问题,以帮助所有人更好地理解和参与开源。</p><hr><p><strong>隐私计算开源框架Rosetta:数据安全融合新方向</strong></p><p><strong>谢翔博士,矩阵元 - 算法科学家 </strong></p><p>数据隐私问题已经成为大数据和AI行业最为核心的痛点,如何保证分布在机构间的数据在保护各自隐私的前提下进行融合计算已经成为迫切需求。隐私计算为机构间数据的安全融合提供了新的技术方向,而密码学则是隐私计算中最为核心的技术之一。本次报告中,谢翔将系统的讲述隐私计算整个行业的最新进展,密码学技术的基本原理以及密码学与大数据领域、AI领域的结合。最后,将介绍基于TensorFlow的隐私计算开源框架Rosetta,让不熟悉密码学的大数据、AI研究人员/开发者也可以无门槛的使用隐私计算技术。</p><hr><p><strong>第二场 10月25日 13:30 开始</strong></p><p><strong>Apache DolphinScheduler是如何支撑每日十万级大数据任务调度的</strong></p><p><strong>代立冬,易观数科 - 大数据平台总监</strong></p><p>本次分享首先会介绍DolphinScheduler(Incubating)社区的发展情况,接着介绍我们当时为何要重复造轮子再造大数据任务调度,DolphinScheduler整体的设计思想、考量以及DolphinScheduler的特性和能力,然后介绍DolphinScheduler架构的变迁过程。分享中我也会讲述我们在做大数据任务调度时遇到的挑战和积累下来的经验,也会介绍一些用户案例和使用场景及开源的历程。</p><hr><p><strong>从 ClickHouse 的名字来历说起</strong></p><p><strong>朱凯,远光软件 - 大数据/平台开发部 总经理</strong></p><p>ClickHouse是一款开源的OLAP数据库,自2016年开源以来它一直保持着飞速的发展速度。其闪电般的查询性能和活跃的社区,让它成为目前业界公认的OLAP数据库黑马。这次分享将带大家快速领略ClickHouse的全貌特征,ClickHouse它是什么、它的核心功能有哪些以及它可以用在哪些场景。与此同时,朱凯也将和你一同分享2020年ClickHouse最令人期待的 top 5 新功能。</p><hr><p><strong>Apache IoTDB:工业物联网数据库管理系统</strong></p><p><strong>黄向东,清华大学 - 助理研究员</strong></p><p>工业物联网数据的主体是机器产生的时序数据,是工业互联网的原矿。与其他大数据不同,其具有高通量、低质量、弱模式、查询分析复杂等特点。Apache IoTDB 是从中国高校发起的,经过多年迭代,在多个工业生产系统中经过验证的新一代工业物联网数据库管理系统,目前已成为Apache顶级项目。本报告将详细介绍工业物联网中的挑战,Apache IoTDB的基本概念和特性,并简单介绍基于Apache IoTDB的相关实际案例,帮助听众了解如何基于Apache IoT生态,解决工业物联网数据应用需求。</p><hr><p><strong>Apache Kylin 4:凤凰涅槃,浴火重生</strong></p><p><strong>张智超,上海跬智信息 - 大数据架构师</strong></p><p>Apache Kylin 4.0 Alpha版本日前已经发布,它是Apache Kylin 4的第一个早期预览版本,是继Kylin 3之后的一个重大架构升级版本,采用Parquet这种真正的列式存储来代替HBase存储,提升文件扫描性能;同时重新实现了基于Spark的构建引擎和查询引擎,使得计算和存储分离变为可能,更加适应云原生的技术趋势。本次演讲嘉宾张智超将从架构升级,原理讲解,重大特性等几个方面来介绍Apache Kylin 4.0。</p><hr><p><strong>T3出行构建数据湖上低延迟数据管道的实践</strong></p><p><strong>杨华,T3 出行 - 大数据平台负责人</strong><br><strong>赵玉威,T3 出行 - 调度平台高级研发工程师</strong></p><p>T3 出行是一家基于车联网驱动的网约车平台,拥有海量且丰富的数据源。为此在很早就基于 Apache Hudi 构建了企业级的数据湖。但数据湖从外界摄取的数据源绝大部分都是原始数据,而为了使原始数据变得更有业务价值和分析价值,T3 出行 需要对数据进行 ETL 等进行脱敏。这时为了解决低延迟、高效的数据加工,最初引入了 Easy Scheduler(DolphinScheduler前身),在使用过程中发现了不少问题。随着 DolphinScheduler 加入 Apache 孵化器进行孵化并快速迭代,T3 出行也随之升级到了 DolphinScheduler 并围绕它打造了一个企业级的大数据调度管理平台。这次分享 T3 出行将会对基于 Apache DolphinScheduler 支撑数据湖上低延迟数据加工的实践进行介绍。</p><hr><p><strong>PowerJob:新一代分布式任务调度与计算框架</strong></p><p><strong>滕佶祺,阿里巴巴 - 开发工程师</strong></p><p>PowerJob是新一代的任务调度中间件,旨在解决大型离线任务的调度与计算问题。PowerJob立足于当前繁杂的业务特性,在任务调度的基础上,创新性地提供工作流 workflow 和分布式任务计算 MapReduce 两大核心功能。本次演讲将会为大家揭秘 PowerJob 项目的起源、旨在解决的问题和背后的技术剖析。</p><p> </p><hr><p><strong>彩蛋:QA & 抽奖</strong></p><p>会场还设有 <strong>QA</strong> 和 <strong>抽奖</strong> 环节,奖品如抱枕、热火大数据书籍等赠送。数据技术专场 24 日特别邀请 Apache Doris PPMC 缪翎 女士主持(传说中一个明明可以靠颜值却偏偏拼才华的奇女子)!!! </p><p>大会已开启报名,对 COSCon'20 内容感兴趣的你,可以通过下方的链接或点击阅读原文进行报名,期待你的参与!除了在线上观看直播外,本次峰会将在<strong>北京、上海、深圳、成都、长沙</strong>五城展开线下聚会,审核通过后即可免费报名参加~</p><blockquote>会议报名链接:<br><a href="https://link.segmentfault.com/?enc=U86LDJjxPgYueAAWEMSCQQ%3D%3D.6d7qZTbj2f68JWiqJenk6jEZjnpAKIr8h9HK9YV51ylma75JNxNU6%2FHQ7PaKpKlJ" rel="nofollow">https://www.bagevent.com/even...</a><p>线上直播链接:<br><a href="https://segmentfault.com/area/coscon-2020">https://segmentfault.com/area...</a></p></blockquote><p><img src="https://segmentfault.com/img/bVbMd4g" alt="segmentfault 公众号" title="segmentfault 公众号"></p>探寻融云多年领先的秘密:不断创新贴近开发者真实需求https://segmentfault.com/a/11900000225785412020-05-08T11:43:05+08:002020-05-08T11:43:05+08:00思否编辑部https://segmentfault.com/u/writers11
<p><img src="/img/remote/1460000022578544" alt="" title=""></p>
<p>融云全名北京云中融信网络科技有限公司,是一家安全、可靠的全球互联网通信云服务商,向开发者和企业提供 IM 即时通讯和实时音视频通信云服务。 </p>
<p><strong>经过近 6 年的发展,融云已经连续多年稳居 IM 即时通讯市场第一。</strong>目前,融云业务覆盖全球 233 个国家和地区,日活超 7 千万,SDK 触达用户 45 亿,日均消息量 150 亿,峰值的单日消息量最高 2218 亿。</p>
<p>即在全国的手机用户中,平均每个手机中至少有 5 款App的底层通信能力由融云赋能。从平台服务用户数量级来说,融云已跃升为继微信、QQ之后的我国第三大通信云平台,而作为PaaS服务,融云则稳居互联网通信云赛道第一。</p>
<p>能取得如此瞩目成绩的背后,是融云多年来在技术研发和服务领域的奋斗和努力。究竟融云在这6年的发展中做对了什么?对此我们专访了融云产品及解决方案 VP 林光柘,请他为我们讲述融云取得成功的秘密。</p>
<hr>
<p><strong>思否:能否请您先介绍一下主要工作经历,专注的技术研究方向,以及目前所负责的工作。</strong></p>
<p>林光柘:我在 2016 年加入融云,之前有十几年的 ToB 领域工作经历,主要是在用友和致远互联的企业级服务经验。</p>
<p>在加入融云后依然在做企业级服务的工作,但服务的方向从 SaaS 或者说企业级软件产品更偏向了互联网产品,领域也更加细分成为客户提供专业的互联网通信云能力。目前更多是专注在 IM(Instant Messaging)、RTC(Real-time Communications)等通信能力相关的服务与通信行业的研究。</p>
<hr>
<p><strong>思否:融云在此次疫情防控中为社会和企业贡献哪些力量?</strong></p>
<p>林光柘:因为疫情很多人无法到办公室办公,也无法到线下进行面对面交谈。促使包括远程教育、远程医疗、电商直播和企业协同办公等行业在近期有了一个井喷式发展。</p>
<p>融云可以看到平台上已有客户的业务量级翻了好几倍,甚至是十几倍。之前没有和融云合作的客户现在也大量的接入融云。</p>
<p>为了保证企业在这个关键时刻可以平稳运行,融云团队在春节期间就加班加点开始了服务工作,正式开工后无论是在家办公还是在办公室工作的同事也都非常繁忙。</p>
<p>为了帮助更多企业机构一起抗击疫情,融云在疫情期间还免费开放了在线医疗、在线教育及协同办公场景的通信能力,近期还成功入围“创客北京2020”疫情防控专题赛50强。</p>
<hr>
<p><strong>思否:疫情之下开启了哪些业务新场景?从通信云服务商的角度看以在线 VR 看房为例的 VR 业务未来会有怎么的发展?</strong></p>
<p>林光柘:很多人认为即时通讯就是我给你发一个消息或者文字。<strong>但其实整个行业对即时通讯的定义已经发生了改变,现在更多的客户会把即时通讯当成是信令的控制。</strong></p>
<p>VR看房是我们最近看到的一个领域,但其实在 VR 看房之前就与一些客户在新场景下进行了合作。</p>
<p>比如说在去年与教育行业客户合作时,就使用消息来做一些教具的同步操作。老师在控制教具的同时学生这边就会发生相应的变化,学生与学生之间传递教具也同样会实时发生变化。其实这些所有的传递过程都是用即时通讯来实现的。</p>
<p>融云亲历整个即时通讯行业的发展,从传统的提供发送图片、文字和语音的能力,到现在已经深入到客户的业务之中,更加模块化场景化的为客户提供服务。</p>
<p>说回到 VR 看房,传统的 VR 看房是客户体验一个房屋,由客户自己看就好,现在最主流的 VR 看房的逻辑已经发生改变。经纪人进入到房屋并转动手机查看房屋,客户实时同步画面信息。</p>
<p>其实这些所有的过程都是用 IM 来完成的。IM 帮助 VR 视频的两端进行房屋状态与位置的同步,当然观看过程中同时也发起了音视频通话,相较于传统的 VR 一对一看房,融云提供音视频支持,可以满足更多用户同时处于 VR 看房的场景之中。经纪人还可以随时讲解,实时答疑,减少消费者的决策时间和成本,提升房源销售效率。</p>
<hr>
<p><strong>思否:疫情之下融云为什么会被更多企业选择?融云 IM 和实时音视频两大业务线的优势有哪些?</strong></p>
<p>林光柘:融云虽然不是 BAT 一样的超巨型企业,但从 2014 年成立以来一直专注于 IM 通信行业。没有做更多的业务层扩展,也拒绝跟随社会上一些所谓的风口。这样<strong>促使了融云在通信行业的专业精通。</strong></p>
<p>并且我们发现融云从成立以来几乎所有的需求都来自于开发者,凡是开发者提出的通用需求,那么一定是可以被其他企业复用的,融云拥有大量的开发者需求建议。这有两点好处,一是来自开发者的意见最为贴近真实需求,二是融云保证了从成立以来快速的迭代与发展。</p>
<p>虽然有人可能会说 IM 这个事情非常简单,但因为一直保持着快速的版本迭代,不断有一些新的场景新的应用融入进去,让融云建立了自己强大的技术优势。</p>
<p>IM 和实时音视频虽然并不分家,但也并不是普通用户所认为的 IM 和实时音视频完全一样。<strong>从底层的逻辑来说 IM 和实时音视频是完全不一样的。</strong></p>
<p>从技术线路与技术逻辑来看,比如呼叫、接听和操作等全部是 IM 的过程, IM 比实时音视频的稳定性要高出很多。又比如看到对方的状态,或者向对象进行一些操作也都是 IM 的过程。融云天然地把 IM 和实时音视频整合成了一套 SDK。在给客户提供完整一体化的解决方案上融云拥有天然的优势。</p>
<p>音视频通话至少要连的上,那么连的上靠什么保证,那就是要靠 IM 信令全部有机的结合在一起。</p>
<p>几乎所有的大厂都会说自己有音视频的能力,甚至包括一些 IaaS 厂商也会说自己有音视频的产品,但很少厂商会说自己有 IM 能力。</p>
<p>其实实时消息时序和一致性是分布式系统架构设计中非常难的问题,尤其 IM 应用这种以消息为中心的应用形态。<strong>融云是业界唯一承诺消息不丢、不重、不乱序的通信云厂商,通过消息重发补偿等机制,确保信息 100% 到达,这也促成了融云在 IM 的能力上有绝对的自信。</strong></p>
<p><img src="/img/remote/1460000022578545" alt="" title="">融云IM消息送达流程图</p>
<hr>
<p><strong>思否:融云的海外业务受到了什么影响?做了哪些努力来保证业务顺利进行?</strong> </p>
<p>林光柘:海外市场不是说我今天要干,一次性投入我今天就能干好。融云其实从 2016 年开始就协助中国的企业出海,并且一直不间断的对出海业务做持续的投入。</p>
<p>现在融云拥有 IM 厂商独有的海外数据中心和全球加速节点网络,都是与这么多年的持续投入分不开的,也正因为如此融云在面对疫情的时候没有任何慌乱。</p>
<p>海外服务到底稳不稳,不是说客户在外面找到几个测试点就能测出来的,一定要有大量的海外客户与 C 端覆盖才能进行大规模验证并给出答案。</p>
<p>如何保证海外业务的稳定?融云从自建全球底层通信架构和自研的最优链路调度算法给出了答案。<strong>一条消息从美国到中国,通常要经过100多跳,而通过融云的链路加速可以缩短为6跳</strong>。客户可以择优选择就近接入节点,规避复杂网络环境带来的不稳定、高延时连接问题。</p>
<hr>
<p><strong>思否:ZOOM深陷用户隐私泄露的困境中,融云在视频会议业务中是如何保护用户隐私数据的?涉及到什么技术?</strong></p>
<p>林光柘:融云作为 PaaS 服务平台有一个整体的设计来保护用户的安全,首先融云保证绝不触碰用户数据,其次保证不触碰用户的任何业务信息。</p>
<p>我们最近接触到了一位新加坡客户,目前他们使用 ZOOM 来进行办公会议等业务,但最近接到相关政策通知未来不能继续使用 ZOOM。</p>
<p>因为融云在海外有非常好的技术储备,客户通过集成融云 SDK 直接就可以上线,不需要用户的任何信息,只需要一个特别简单的 UID(User Identification)就可以实现 IM 和实时音视频的所有场景。所以这位新加坡客户正在考虑与融云合作,当然这也是对融云的一种认可。</p>
<p>对融云有所了解的开发者可能知道,融云核心技术团队来自飞信,我们积累了飞信处理海量并发的经验。所以在技术选型上,融云并没有采用大家耳熟能详的 XMPP、SIP、MQTT 等通用的通讯协议,<strong>而是从成立之日起,代码层就完全从0开始做正向研发,满足移动互联网时代的开发需求。</strong>融云自研了协议名称为 EverSync 的私有通讯协议,数据在通信过程中避免了明文传输与存储,同时还具备防篡改能力和防劫包重发的能力,从而完全解除了客户对安全的后顾之忧。</p>
<p>也正因为我们完全符合严格的GDPR(General Data Protection Regulation),可以无障碍的为我们的客户提供全球服务,满足各个国家和地区的合规性要求。</p>
<hr>
<p><strong>思否:融云如何实现特殊场景下的抗弱网环境和 QPS 承载能力的高稳定性?</strong></p>
<p>林光柘:<strong>在解决这个问题上没有任何捷径,我们是靠一个一个坑趟出来的。</strong></p>
<p>融云的做法是研发与测试拿着笔记本去模拟,也就是实时地去各种场景测试。前年开放了飞机上的 WiFi 环境,我自己因为出差比较多,有时间的话也会在飞机等一些特殊场景下进行测试。</p>
<p>之前有一个客户开展了埃及的海外直播业务,开始的时候选择了一家大厂为其服务,但是发现很多场景下网络连不上。随后这个客户找到了融云,不过融云在当时也没有很好的解决这个问题。</p>
<p>但融云的优势就在于灵活,发现问题后,我们的研发同事直接就冲到现场,快速地沟通收集相关连接信息,通过排查发现,可以通过优化最底层协议栈的逻辑,进一步提高抗弱网的性能,来满足当地的网络环境,研发马上投入去改底层的SDK链接逻辑,给客户提供新版本的SDK上线,最终我们完美的解决了问题。</p>
<p>接下来讲下 QPS 承载能力高稳定性的问题,融云最开始的架构支持聊天室承载上限是 3 千人,当互联网直播业务刚起步的时候,我们就意识到直播聊天室将要井喷式发展,在 2015 年快速调整聊天室架构,很快速地上线了高并发的直播聊天室业务。</p>
<p>到之后可以承载十几万到几十万高并发的最大数据,甚至可以承载更大的用户数据量,曾经有客户一天传送了一千亿条消息也侧面证明了融云的能力。</p>
<p>业务中融云提供后端服务端实时监控,发现有过阀值的时候动态横向弹性扩容,确保稳定的同时让客户完全不会感知到压力变化。</p>
<hr>
<p><strong>思否:融云为了贴近开发者做了哪些努力?</strong></p>
<p>林光柘:现在融云的客户端接口有近600个,服务端接口超过100个,后台可以开通的功能也有100个左右,并且都是不同的场景需要个性化开通的功能。开发者实际使用的时候 IM 的业务逻辑比实时音视频复杂,实时音视频的技术难度也相对较高,两者相辅相成又都有各自的难点。所有这些点集合在一起,如果没有明确的指导掌握起来会有些难。</p>
<p><strong>开发者想要把这些接口使用好,逻辑其实就像乐高拼接积木一样,如果有清晰的说明书就会简单很多。如果只是使用乐高散件,想要去拼成一辆汽车,这个事情就会非常困难。</strong></p>
<p>其实融云2014年到今年春节前的文档都还有优化的空间。为了更贴近开发者的需求,融云今年专门组建了一个文档专项团队,团队成员全部拥有两年以上的支持服务经验,他们知道用户的问题、卡点和使用场景。专项团队的成员共同配合写了一个全新的文档,方便开发者去阅读理解业务。</p>
<p>文档中的内容完全是以客户希望看到的场景为视角,并且我们正准备未来让所有研发都要站在开发者的角度来想问题。后续我们还会考虑会做一些新的视频或者代码片段,让开发者更加轻松。</p>
<hr>
<p><strong>思否:融云短期内最重要的计划是什么?</strong></p>
<p>林光柘:我们依然会在 IM 和实时音视频这两大业务上持续投入,提供更加贴近场景化的解决方案,满足当下社交、直播、教育、电商、医疗、游戏等行业对通信云能力的新需求。</p>
<p>可以发现融云现在依然还有很多需求在排期中,作为一个拥有两百多人的团队、专注于 IM 与实时音视频业务多年的公司,不仅在业务层更贴近开发者及企业需求,我们也希望追求技术性能的持续优化,通过不断完善细分领域的技术难点为客户带来更稳定、高效的服务。</p>
<p><img src="/img/remote/1460000022578546" alt="" title=""></p>
<p>融云产品技术云图</p>
<hr>
<p><strong>思否:还有什么想对外界一直关注融云的朋友们说吗?</strong></p>
<p>林光柘:有一部分用户可能有这样的想法:「有 QQ 和微信为什么还会有融云这样业务?」虽然都是即时通讯,但服务群体是完全不一样的,微信和 QQ 是我们手机里的应用,服务对象是 C 端用户,而融云则是 PaaS 服务,为应用提供底层的通信能力,包括像汽车之家、哈啰出行、寺库、易车、荔枝等在内的 30 多万个应用,他们的用户可以在 App 里实时交流互动。</p>
<p>融云现在已经成为了互联网级产品所不可分割的一部分。客户的业务系统去解决一个短链接的业务是非常容易的,但如果想大量的交互,想要不同客户端之间互联互通,甚至是说像 VR 和硬件一体化问题的解决,在这个智能物联网加 5G 时代马上到来之际,可以提供强大通信能力的融云将有更大发展空间。所以融云未来的发展非常可期,也希望大家可以持续关注融云。</p>
<p><img src="https://segmentfault.com/img/bVbFPnI" alt="clipboard.png" title="clipboard.png"></p>
不扩容提升十倍 x86 软件性能,云杉网络如何用产品思路满足客户需求?https://segmentfault.com/a/11900000224275632020-04-20T10:25:33+08:002020-04-20T10:25:33+08:00思否编辑部https://segmentfault.com/u/writers11
<p>云时代,本地部署的企业级软件在不扩容的情况下,能做到短期内十倍的性能提升的确是一件令人侧目的成绩。</p>
<p>众所周知,x86 的性能已经被压榨到了极致,带着种种疑问 SegmentFault 思否社区采访了云杉网络研发总监向阳。访谈中,向阳详细谈了在企业数据中心网络场景下各种时序数据库的表现,并解释了云杉网络如何从工程的角度实现 x86 软件十倍性能的提升。</p>
<hr>
<p><img src="/img/remote/1460000022427566" alt="" title=""></p>
<p>向阳:云杉网络研发总监、网络架构师。负责云杉研发团队的管理和 DeepFlow 的架构设计和核心功能实现。</p>
<p>2013 年获清华大学计算机科学与技术博士学位,师从吴建平教授并独立实现了世界上第一个基于关联分析的 BGP 劫持检测系统,因此摘得 Internet Measurement Conference( IMC,网络测量领域国际顶级会议)社区贡献奖。2015年获得清华大学博士后证书,主要研究方向为云数据中心网络架构,获得了多项网络安全、云数据中心相关专利。</p>
<hr>
<p><strong>思否:能否请您先介绍一下主要工作经历,专注的技术研究方向,以及目前所负责的工作。</strong></p>
<p>向阳:我的工作经历其实比较简单,在加入云杉之前,我在清华大学读博。师从吴建平院士做一些包括域间路由的算法和结构、域间路由的安全等等方面的工作。毕业后,我接触到 SDN 的领域,也就顺理成章地加入云杉,然后一直做 SDN 的研发工作直到现在。现在我在公司是研发团队的负责人和 DeepFlow 产品线的负责人。</p>
<hr>
<p> </p>
<p><strong>思否:随着业务需求的提升以及云计算等相关技术的发展,企业开始建立自己的云数据中心,其中网络是云数据中心的重要组成部分之一。您认为现代企业的云数据中心在网络架构的搭建上通常有哪些痛点?企业应当如何应对这些挑战?</strong></p>
<p>向阳:我们能看到的企业在去做这一块的时候,主要的一个挑战其实可以分为两个方面,一个方面就是说怎么去建设,另外一个方面,其实还要去考虑到怎么样去维护它。</p>
<p><strong>建设主要解决两个痛点:一个是网络连通性的问题,一个是网络服务化的问题。</strong></p>
<p>为了支撑业务,首先要把异构的资源、混合云这些场景下做一个打通和互联;然后在此之上提供丰富的网络服务,包括像应用交付服务、安全服务等等。</p>
<p>与上述问题平行展开的,是复杂网络的运营维护问题。因为现在网络会相当的复杂,一般来讲 IT 基础设施会同时在公有云、在私有云不同的资源池上,此外还有虚拟化的一个容器资源池。在这样一套 IT 基础设施上要打通一个统一的网络,才能支撑业务的灵活需求。</p>
<p>比如说一个业务要想在容器的资源池里面去拿到几个 POD,在虚拟机资源池里面拿到一些虚拟机,在裸机资源池里面拿到几个物理机来实现一个业务需求,这个时候实际上这些<strong>资源池是互相独立的,但是从网络的视角看(这个业务)是一个整体,要将上述资源池的这些网络打通、做统一的编排,这是一个挑战。</strong></p>
<p>在此基础之上,如果说我们把网络做了打通,那么这个网络维护的难度也是非常高的,不可能再由人工去做维护 —— 如果说这张网增加了 10 倍的复杂度,那就意味着至少要投入 10 倍的人力,这件事难以为继。</p>
<hr>
<p><strong>思否:云杉网络为了帮助企业解决网络运维管理上的挑战,早在 2016 年的时候就推出了云网分析产品 DeepFlow,能否请您先介绍一下 DeepFlow的核心组件、功能特点以及应用场景?</strong> </p>
<p>向阳:实际上<strong>我们把 DeepFlow 的一个解决方案划分成两个场景,一个是采集分发,另外一个是分析。</strong>那也就对应着DeepFlow的整个产品中的三个核心的组件:采集器、分析器和控制器。</p>
<p>从组件的角度来讲,控制器负责中央的管控和大规模(采集器)的管理,因为我们的采集器会运行在很多异构的环境里面 —— KVM 虚拟化、VMware 虚拟化、公有云的环境、私有云的环境、容器的环境、Linux 的环境以及 windows 的环境 —— 这时采集器的特点是运行的环境异构,另一个特点就是采集器的数量非常大。</p>
<p>控制器它需要做的就是一个集中的大规模的管控;而采集器需要做的就是刚才对于这些异构环境的一个全网覆盖,包括物理的、虚拟的等等,做一个全网的覆盖;以及我们需要有一个高性能的策略匹配的算法。</p>
<p>因为<strong>如果对所有的流量数据全部做处理,这个时候的资源开销将会非常大。</strong>有的流量我们可能只是希望看一看,有的流量我们希望把它的一些 counter 记录下来,还有的流量会进入它的 pcap 文件,进入它的一些详细的数据包,以及把一些流量直接分发出去。</p>
<p>不同的流量需求,我们就需要通过一个策略的体系去对它做一个相当于编排。通过匹配,把符合某意图的一些流量,给到后端对应的消费工具里面。这样的话我们在采集这一侧是需要有一个较强的策略匹配引擎,再到后面我们的流量除了去分发给第三方的分析工具,传统的 NMP、DPI 以外,我们还能自己做一些分析,这就是我们的分析器。</p>
<p><strong>我们的分析器主要一个特点,就是通过一个分布式的时序数据库,来将网络中的所有的状态和统计数据存储下来。这相当于对网络的全景视图做一个刻画。</strong>客户再去做混合云场景下的一个网络排障的时候,能把所有的这些关联点,不同的网络、不同的层面,不同的 Overlay、不同的 Underlay —— 比如说在容器的场景下可能是双层的 Overlay —— 把它们都联系起来。</p>
<p>再回到应用场景。第一个是混合云上流量的采集和分发。这种应用场景一般是针对于客户已经有了很多传统的分析设备,比如说 DPI 的设备、NPM 设备等等,但是他们苦于无法拿到虚拟网络、容器网络里面的流量。</p>
<p><img src="/img/remote/1460000022427567" alt="" title=""></p>
<p>在虚拟网络的场景下,网络的规模非常大,现在一个服务器可以虚拟出来 10 个虚拟机,一个虚拟机可能又有 10 个 POD,这个数量是非常庞大。因此在虚拟网络里你不能像传统物理网络那样通过分光、镜像直接拿流量。我们能做到全网覆盖,按需的把流量拿出来给到后端的分析工具。</p>
<p>另一个场景就是混合云的网络诊断,这实际上是网络分析的场景。因为我们看到现在的云的网络是充分复杂的,这里面有异构的资源池,有不同层级的 Overlay,我们怎样在这样一个复杂的网络环境下去做故障的诊断定位?这需要我们有一个全网流量数据的分析能力,即网络分析。</p>
<hr>
<p><strong>思否:DeepFlow 自 5.0 版本之后的每次更新都对性能进行了改善,尤其是 5.5.6 版本后核心组件的性能再次大幅提升,这是如何实现的?是否与编程语言和数据库有关?云杉为什么如此看重性能上的提升?</strong> </p>
<p>向阳:首先来谈一谈这些性能的提升是如何实现的,其实总的来讲包括几个方面。采集这一侧,我们是对于新技术有一些引入,像 DPDK 以及像 Linux 内核高版本的 XDP 的技术,XDP 对于客户的环境的依赖是比 DPDK 要低,并且流量的采集性能比我们上一代的技术能有 10 倍的提升。</p>
<p>另外补充说明一下我们对新技术的引入,我们其实是走在了社区的前面,2019 年发布的 CentOS 8 使用的内核版本对于 XDP 的支持其实并不好,<strong>我们也从内核的层面对 XDP 的支持做了一些提升,使得我们能在低版本的 Linux 环境里面将我们的采集器的性能提升上来。</strong></p>
<p>另外一个方面是分析侧,主要我们是基于数据结构和算法的一个优化。我们整个 DeepFlow 平台,绝大部分的组件都是基于 Golang,稍后再讲我们为什么会去选择 Go。我们对它原生的数据结构 —— 像 map 这样一些数据结构 —— 做了一些非常关键的算法和数据结构上的改变,使得其性能都提升了 10 倍。</p>
<p>这里面我们有一些专利存在,比如说我们对于 Go 的对象资源池、内存池的一些改进,对于 map 的一些改进,这是在分析侧的优化。</p>
<p>然后就是在存储侧的优化,<strong>我们是基于 InfluxDB 数据库,对它的内核做了全新的开发,实现了 10 倍读写性能的提升</strong>,以及具有一个水平扩展的能力,更重要的是使它更适合网络的场景。</p>
<p>回过头来说 Golang,其实和语言的关系还不是太大,如果说我们需要去追求一个极致的性能,我们可能会去选择比如说像 C 这样的语言。但这里还有另外一个问题,就是我们的开发效率和适配性。如果我们用 C 的话,可能对于环境(比如说 glibc 的版本)的依赖会比较严重。</p>
<p><strong>Go 其实是一个云时代的语言,像 Docker 这样的技术,就是构建在 Go 之上的,其依赖是非常小。</strong>我们选择 Go 能够在依赖性和开发效率上获得优势,此外我们也会去克服它的缺点,像它的 GC 带来的缺点、它的数据结构带来的性能问题,这些方面我们都做了提升。</p>
<p>最后说说我们为什么如此关注于软件的效率,因为我们是一家软件公司。硬件公司比如说做盒子的企业会更多地专注于做专用机之类的产品。我们必须做一个云原生的平台软件,这样它才可以运行在任何的地方 —— 在公有云里面、私有云里面、容器里面 —— 它不应该对于运行环境的操作系统以及物理的机器有任何的假设,而且它还需要在不要求硬件环境的前提下给客户更大的效益。</p>
<p><strong>也就是说硬件我们是没有办法改变的,因此我们需要对软件的性能有一个极致的追求,这样才能给客户带来价值。</strong></p>
<hr>
<p><strong>思否:云杉网络在产品研发过程中曾采用过开源时序数据库 InfluxDB,那么 DeepFlow 进行数据库选型与开发的依据是什么?在 DeepFlow 持续迭代的 3 年时间中,在数据库选择方面是否有经历过变动?</strong> </p>
<p>向阳:回到三年前,我们最初在做这个产品的时候,发现时序数据库的发展并不好。当时时序数据库都是基于一些传统的数据库来做的,它不是一个直接面向时序数据场景的数据库。比如说 Elasticsearch,它其实是一个搜索引擎,但被当做时序数据库在用。</p>
<p>当时 InfluxDB 的版本是在 0.x 的时代。我们最初同时在使用 Elasticsearch 和 InfluxDB。一方面依赖于 Elasticsearch 的稳定性,以及它的大规模的水平扩展能力;另外一个方面我们当时其实也看到了,时序数据是一种新的数据类型,它不能够直接全部在现有的这些数据库里面去存储,所以我们当时在小范围内选用了 InfluxDB。</p>
<p>后来我们有一个重要的版本调整,因为 Elasticsearch 作为一个搜索引擎消耗的资源量实在太大了,它不太适合于时序这个场景,更不太适合在一个大规模网络监控数据的场景下做存储。因此我们又全部切换到了 InfluxDB,这相当于是我们数据库选型的第二阶段。再往后其实就是第三阶段,InfluxDB 在开源的版本里曾经一度存在过集群的解决方案,但是在某个版本之后被删掉了 —— 这个功能变成了商用的解决方案。</p>
<p>这是我们切换数据库的一部分原因,其实<strong>另外一部分原因、也是更重要的原因在于我们发现 InfluxDB 不太适合网络的场景。</strong>我们用普通的时序数据库去监控1万台服务器,这 1 万台服务器每个时间点比如说每秒它都会有一个 CPU 的值,那么其数据量就是每秒 1 万的量级。</p>
<p>也就是说这些监控数据是和被监控服务器的数量强相关,但是在虚拟网络场景下,机器(虚拟机)的数量高出几个量级。还是上面的场景,这时如果有任意两个机器之间互访,这个数据虽然到不了前面所说数据的平方量级,但是仍能高出几个数量级以上,而且这种访问的关系还能够去和其他的维度,比如说协议类型(TCP/UDP)、端口号以及服务的数量直接相关。这里面的数据是一个非常高维度的存储,而且是一个相当于稀疏矩阵的存储,它和经典的时序数据库的应用场景还是不太一样。</p>
<p>另外网络的场景下面也存在一些特定的一些需求,比如说查询一个网段、做一个网段的权重匹配,尤其是网络流量基本都是通过负载均摊的方式给到不同的机器去处理。在这样大的一个数据体量下,这个时候我们如何去把不同机器处理的结果聚合之后存储下来,这些场景 InfluxDB 都是不支持的。所以我们基于 InfluxDB 核心的存储和查询引擎,在此基础上做了性能的提升、做了水平扩展的支持、做了高可用的支持,以及做了更多的网络数据的查询、聚合、过滤的支持。这样最终形成我们现在使用的、自研的网络时序数据库。</p>
<p>我们其实测过像 Prometheus 这样的很多后端的长期存储方案,因为 Prometheus 适合短期的数据存储 —— 通常就存一到两天。它有很多后端的存储,像 S3DB (Simple Sloppy Semantic Database)、VictoriaMetricsDB 等有很多这样的数据库。<strong>从开源社区的时序数据库排行来看,InfluxDB 是排在第一位的,但是其他的数据库会比它的性能测试数据要好看。</strong></p>
<p>这个性能测试其实也是各家测的,而且很重要的一点,其它的数据库往往是局限在某个特定的场景下的测试数据比较好看,或者它的使用量还没有达到广泛使用的程度。所以我们在考量的时候,也基于InfluxDB去做自己的时序数据存储。</p>
<p>另外一个层面,现有的时序数据库都是基于相同的场景,即对物理服务器进行固定频率的监控,而网络监控的场景不是这样。网络监控的对象是海量的一维 IP、二维的 IP 对、三维的 IP 端口号等等,这显然不是固定频率的监控,而是一个稀疏矩阵的监控。这种差异性使得我们现在也在考虑,例如所有现存的时序数据库都在使用 TSM 这种数据存储结构,因此我们也在这种数据存储结构上进行下一代产品的研发,使之支持稀疏矩阵的 TSM 特性,以便更好的去存储和检索网络数据。</p>
<p>简单的说,因为 InfluxDB 的使用范围更广、更成熟、更稳定,而且其他的时序数据库在最底层的算法层面和 InfluxDB 实际上是一样的。那么也就是说这个测试性能的差异,可能是测试方法或者使用场景或者其他方面的差异,我们认为这个(测试性能)差异其实是可以忽略的。</p>
<hr>
<p><strong>思否:云杉网络在产品研发过程中采用了开源的数据库组件,目前对开源有什么想法吗?</strong> </p>
<p>向阳:我们目前还不是一家开源软件驱动公司,未来我们可能会把一些组件反馈给社区。我们也看到在 InfluxDB 社区版本把集群的能力拿掉了,我们认为我们的集群功能做的还是相当好的,它非常方便运维,不依赖于像 zooKeeper 的 ZAB 或者 Raft 这样的集群协议,是一个非常适合时序数据场景的高可用的集群方式。<strong>如果我们把自研的集群实现以及水平扩展的查询能力贡献到社区,这对于社区的运作可能会有冲击,因为社区已经把一部分能力放到了商业化的版本里面。</strong></p>
<hr>
<p><strong>思否:DeepFlow 开放了开发与数据的接口,客户可以在 DeepFlow 上开发个性化的应用与工具,那么 DeepFlow 目前支持哪些编程语言?</strong> </p>
<p>向阳:对于客户自定义开发,我们现在提供了两种方式,一种方式是 API,这个 API 因为它是 RESTful 的,所有的语言都能够去调用。</p>
<p>另一种方式是基于 Python 的 SDK,我们看到 Python 有很多方面的优势,包括它的用户基数大、使用门槛低以及拥有丰富的库,它在数据处理和网络编排等方面有天然的优势。</p>
<hr>
<p><strong>思否:未来还会在编程语言的支持上进行扩展吗,比如 Java?这些客户自行开发个性化的应用会影响 DeepFlow 的性能吗?</strong> </p>
<p>向阳:目前我们在这一个方面的计划主要是客户驱动。客户通过我们的 API 自行开发的应用对 DeepFlow 的性能不会产生什么影响。在我们的产品模块里, InfluxDB 存储引擎之上还有一个分布式的查询引擎,它主要做很多分布式的计算。实际上 API 调用是把计算的任务交给了我们的分析器集群,大量的工作是在分析器的集群里完成的。因此 API 调用方的效率不会成为整个查询链条的瓶颈,因为最终给到API调用方的数据是一个充分聚合后的数据结果,它的体量和我们在平台里面存储的数据(例如一个月的网络数据)相比远不是一个量级。不管客户选择什么语言进行自定义开发,DeepFlow 的性能都不会受影响。</p>
<hr>
<p><strong>思否:当前环境下,互联网公司在产品研发上大都会选择敏捷开发、快速迭代的方式。而 DeepFlow 则在 5.0 版本之后实现了软件架构的解耦,那么是什么因素促使你们决定这样做的呢?您又是如何看待软件架构稳定性与需求变化快速应对能力之间的平衡的?</strong> </p>
<p>向阳:我们在 DeepFlow 研发的过程中,版本迭代周期也在不断变化。在三年前我们的迭代周期是 6 个月——这对于一家 to B的公司比较常见。但是我们的产品是运行在云的环境下,快速迭代的能力非常重要。我们必须将产品快速交付给客户,而<strong>客户的环境对我们来说不是一个可运营的系统,也无法让我们的产品一天更新多少次。我们需要在这种情况下做一个取舍,确保我们的迭代周期要尽量低、同时产品的稳定性要非常高。</strong></p>
<p><img src="/img/remote/1460000022427568" alt="" title=""></p>
<p>在这样的背景下,我们做了 DeepFlow 平台的解耦,使得其迭代周期从三年前的 6 个月逐步降到 3 个月、再逐步降到现在的 6 周,满足了我们对客户需求的快速响应 —— 不是在项目中,而是在标准化的产品版本中就能满足。</p>
<p><strong>我们用产品化的思路应对不断增长的客户需求</strong>,解耦后的产品分上下两层,上面是应用层、下面是平台层。平台层追求的是高性能和稳定,应用层追求的是灵活性和高效率。在产品迭代过程中,我们可以有选择的去安排上层和下层的迭代周期。比如说在连续的几个版本里面,底层的平台是不需要迭代的,但与此同时,每一个版本我们都可以对上层的应用做更新,以满足客户的新需求。</p>
<hr>
<p><strong>思否:除了实现解耦之外, DeepFlow 在软件架构上是否还进行了其他方面的调整?原因是什么?</strong> </p>
<p>向阳:我们在 DeepFlow 研发过程中有一个非常明显的变化,最初我们在做这个产品的时候使用了大量的开源组件,这其实也是很多同类产品的做法,但这对产品的稳定性是一个非常大的考验。因为开源组件更多的是面向运营,需要有人去值守;因为代码不是完全由我们自己掌控的,一旦出了问题,解决的速度也会比较慢。</p>
<p>后来我们慢慢的去切换到了另一种模式,即自研大量的组件。<strong>现在我们产品里完全属于开源组件的是 MySQL,因为它实在太经典、太稳定,我们不需要对它做什么改动;除此之外,其他组件都是我们自研的。</strong>我们从以前充分使用开源组件走到了自研加使用开源的库的道路上来。因为开源组件比如 Elasticsearch 的核心其实很稳定,但它的很多周边组件比如输入输出、启停等操作往往容易发生问题。</p>
<p>我们现在会用一些非常成熟的库,我们也会像替换 InfluxDB 一样逐步替换其他组件,现在我们仅仅只是有 InfluxDB 核心的存储和查询引擎,但这一部分我们也在慢慢替换,因为 InfluxDB 基于经典的 TSM、不太适用于网络的场景。</p>
<hr>
<p><strong>思否:产品组件里 MySQL 跟 InfluxDB 主要承担的角色有什么不同吗?</strong> </p>
<p>向阳:MySQL 主要是存储一些 metadata,我们叫做元数据,就是一些业务层面的数据;而 InfluxDB 存储的是时序数据,即有许多资源对象,它们每时每刻都在生成一些统计数据,我们将这部分时间维度上的统计数据存在了 InfluxDB 里面。</p>
<hr>
<p><strong>思否:元数据和时序数据存在不同的地方,查询时的性能会不会有影响? </strong></p>
<p>向阳:这两种数据存在同一个地方并不太适合对数据进行维护。比如对于业务数据或者关系型的数据,例如对一个虚拟机关联的 Interface、关联的 IP 怎么去做增、删、查、改?</p>
<p>如果每个时间点都去存对应的信息,一旦虚拟机本身产生了变化(这种情况经常发生),那么就需要对它的历史数据做相应的改变。而时序数据则不同,时序数据是面向特定的对象的固定时间点的统计数据,基本不存在对于历史数据做修改的情况;唯一需要做修改的场景是在做故障恢复时,或者该对象有变动时。举个容易理解的例子,数序数据的存储场景有点就像对电商的产品页面做存储,一个 SKU 的商品名、图片、介绍等属性(特定对象)很少变动(除非下线),但价格和库存的实时数据经常在变、甚至一直在变。</p>
<hr>
<p><strong>思否:DeepFlow 自身的应用在调用平台层的时候跟客户开发个性化应用时的调用有什么不同?</strong> </p>
<p>向阳:区别就是我们给客户加上一个权限认证的机制,其他的没有大的区别。系统原生的应用和客户自己开发的应用是完全平等的。我们非常重视让客户加入整个产品链条中来,包括客户开发一些应用,以及客户在我们的产品里生成的数据。</p>
<hr>
<p><strong>思否:云杉的客户主要都是集中在金融、电信、制造这些传统行业的企业,我们对这些企业的印象一般都是慢。这些客户的业务没有那么多的快速变化,为什么云杉要在性能上、在快速迭代上,去做这些极致的提升?</strong> </p>
<p>向阳:事实上现在客户的整体技术环境已经发生了变化,尤其是IT的环境。比如在金融银行的客户已经在生产环境大规模使用包括虚拟化、容器、微服务等应用。实际上客户对新技术的引入是比较快的。另外一个层面,这些客户以前买的确实都是“盒子”,现在在云的环境下要去买软件。如果我们的软件去消耗了客户过多的硬件资源,这时软件的价值其实很难体现出来。</p>
<hr>
<p><strong>思否:那么下一阶段 DeepFlow 准备将在哪些方面为客户带来新的提升?是否能透露 DeepFlow 接下来的研发重点?</strong> </p>
<p>向阳:在前面一个阶段,我们主要将 DeepFlow 数据的采集能力和一些数据统计的能力进行了产品化。下一个阶段主要是提升数据的智能分析能力。智能分析能力首先体现在诸如怎样去对于一个网元设备前后的流量做关联等,例如一个防火墙、一个负载均衡器前后的流量,究竟哪些流量属于同一个会话?一个客户访问负载均衡器、负载均衡器又访问一个后端的主机,这个访问链条该怎么绘制?这些体现的都是智能分析能力。</p>
<p>另一个层面是对于不同网络层的关联,像容器网络的数据和下一层虚拟化网络的数据和再下一层物理网络的数据该怎么做关联?<strong>在混合云场景下的这种关联能给客户带来一个完整的、端到端的逐跳诊断能力,这是我们产品演进的一个重要方向。</strong>我们现在已经采集了非常多的网络数据,怎样基于这些网络数据做智能的基线告警、做故障的告警处理,以及做故障的预警,这都是我们下一步要做的事。</p>
<p>从客户的使用层面,我们会更多的去关注客户生成的数据。刚才也提到SDK的方式是一种客户参与的手段,DeepFlow主要还是做一个数据的平台,我们不会限定客户怎么使用这个平台,客户有自己解决问题的想法和思路。我们让客户在这个平台之上去灵活地构建一些监控数据的视图,能便捷地从这些视图中DIY自己的监控大屏,这是我们对客户定制化能力的提升。</p>
<hr>
<p><strong>思否:DeepFlow 有针对行业做一些调整吗?</strong> </p>
<p>向阳:我们主要是从解决方案的层面做调整。我们会组合上下游的产品构建完整的解决方案去给到客户,面向不同的场景、解决不同的问题。</p>
<hr>
<p><strong>思否:对于未来的云网络工程师来说,您认为可能需要掌握哪些技能才会适应将来云时代的发展?</strong> </p>
<p>向阳:以前对于一个网工来讲,面向的是 CLI、有时需要做一些自动化的工作,比如写 Expect 脚本去抓一些 SNMP 数据,但这个时代正在慢慢的成为过去。现在的网工可能更多的是从两个方面提高自己,说到这里我打个招聘广告,欢迎对 SDN 有兴趣的同仁加入我们:<a href="https://link.segmentfault.com/?enc=ucnpbJjRahsIFgmseSN8iA%3D%3D.%2BPiDjHZxS3v4DaIuWHruWCAhuvii79QBBR0Rc03GGW%2FiA1XIF83mG5IXh02jgbvA" rel="nofollow">https://www.liepin.com/compan...</a></p>
<p>首先是自动化。现在一个网工管理的设备数量级是以前管理的十倍,自动化肯定是必须的。刚才提到的Python其实是比较适合自动化的编程语言,而且它的准入的门槛也不高。</p>
<p>其次是面向复杂系统的数据分析能力。不同岗位的人对一个系统监控数据的需求不尽相同,不能期待有一个产品级的东西点一下鼠标就能解决所有问题。网络工程师需要具备,基于采集到的数据稍加处理,能够得到一个自己想要的结果的能力。在网络数据之外可能还有一些系统的数据,例如日志的数据,怎样去做这些数据的关联和分析,目前仍然需要人的创造力。</p>
思否技术人访谈 | “匪气” CTO 易观郭大侠,追寻数据的灵魂之旅https://segmentfault.com/a/11900000213888502019-12-24T18:47:09+08:002019-12-24T18:47:09+08:00波波Nadiahttps://segmentfault.com/u/bobonadia7
<p><img src="/img/bVbB7dj" alt="本文导读" title="本文导读"></p>
<p><strong>技术人:易观 CTO 郭炜</strong><br><strong>本文采编:SegmentFault COO 江波 Nadia</strong></p>
<h2>像找媳妇一样找人才,真情换真心</h2>
<p><strong>Nadia:可以简单介绍一下您此前的求学和职业经历吗?</strong></p>
<p><strong>郭炜:</strong>我是北京人,高中毕业在北大读了七年书,直到研究生毕业。我从研究生阶段学的就是数据,那个时候还不叫数据挖掘,叫信息与信号处理,毕业论文题目是《过程神经网络的客户流失分析》,那个时候(2005 年)还没有 AI 人工智能。毕业后我去了 <strong>TereData</strong>,美国当时最大的数据仓库公司,后来去了 <strong>IBM、中金、万达、联想</strong>,都在聚焦大数据平台建设及项目应用的落地。还是会感觉在大公司在数据创新应用上的体系化管控流程更复杂,也受到了易观创始人于揚的感召,<strong>2016 年加入易观。</strong></p>
<p><strong>Nadia:2016 年易观是什么状态?好像那个时候我印象里的易观还是一个做分析报告的公司?</strong></p>
<p><strong>郭炜:</strong>当时的易观其实已经开始通过数据产品为客户数据洞察赋能了,也开始建起了技术团队,但是整个团队能力其实还不够达标。甚至那个时候,市场上还不太理解技术背景到易观来做什么。所以,我中间有一个阶段,重新调整了技术团队,更加聚焦数据架构、算法等方向。</p>
<p><strong>Nadia:你加入的时候,易观的商业模式是已经规划得很清晰了,还是说也是摸着石头过河?</strong></p>
<p><strong>郭炜:</strong>那时候,易观的创始人于揚一直坚持要做产品和技术,但具体是哪个产品,哪条产品线能做到什么程度我们都不知道,但是我们通过易观千帆(移动互联网产品对标分析平台)迈出了第一步。</p>
<p><strong>Nadia:2016年加入易观之后都遇到了什么挑战?</strong></p>
<p><strong>郭炜:</strong>大家可能都看过 “创业曲线”, 一开始是特别快速的上升,然后断崖式下跌,在谷底沉寂一段时间后还要再跌一下才能慢慢曲线上升——其实创业经历都是这样的。</p>
<p><img src="/img/bVbBUfc" alt="timg.jpg" title="timg.jpg"></p>
<p>我刚进入易观的时候,大家都很乐观,觉得易观有品牌、有想法、有数据源,只是缺技术。我当时也非常乐观,觉得仅仅是把技术弄起来,这个简单。但亲自去做时候才发现,我们向技术公司升级的路上要过的山头真的很大,遇到的问题特别多。</p>
<p>之前我其实已经很多年不写代码了,但那时候没办法,尤其一些核心的模块只能我自己上。2016 年,易观千帆能够承接分析的用户月活跃数据也有接近一个亿了,当时遇到一个很大的挑战就是数据接收并发的问题。在千帆刚开始服务客户的时候发生过一次比较严重的事故,整整 3 天,系统 down 在那里没数据。我印象特别深刻,6 月份,CEO 找我谈话说“你们很辛苦,但是这个问题怎么解决呢?”当时我也不知道怎么解,后来没办法,我重新学了 Lua 语言,然后用了两天时间把代码重新写了一遍,问题解决了。这是当时的状态,整个技术团队对于技术与业务结合的理解其实都还不够,也是从那个时候我发现<strong>创业团队招人最重要,人才是核心</strong>。</p>
<p><strong>Nadia:创业团队不好招人吧?</strong></p>
<p><strong>郭炜:</strong>我们开源项目 Dolphin Scheduler 的核心贡献者代立冬当时是我去找他吃了多少顿饭才说服他加入的。他是第一个大数据方向我觉得不错的人才,也是从他开始,我开始<strong>像找媳妇一样找人才</strong>,到现在也是跟团队和人才们聚会的时间比陪家人的时间长得多。就像糟糠之妻,那个时候你什么都没有,<strong>通过真情换真心</strong>,把这个团队从没有到 1,到 3,5 个,到现在 100 多人慢慢成长起来。</p>
<p><strong>Nadia:你们招人的时候会比较喜欢什么样的人才?</strong></p>
<p><strong>郭炜:</strong>我觉得招人第一是看价值观,是不是真的想做数据这个事,谈到数据的时候,是不是眼睛会有亮光,会有光芒,这个很重要。第二个是看潜力,逻辑性、学习能力、阅读能力、沟通表达能力行不行?第三个才看究竟现在能力怎么样。</p>
<p>究竟会什么、会不会 Hadoop、懂不懂大数据这都不重要,如果你真的很想做这个事,很愿意去学,我们就愿意给你这样的机会。不是每个企业都有这么大的六个亿的月活数据让你去学习,也没有像招商银行、当当这样的客户能够让你去实践。</p>
<h2>郭大侠的开源情怀,易观技术的变与不变</h2>
<p><strong>Nadia:2016 到 2019,您加入易观 3 年,帮助易观从一个大众认知里的分析报告公司,转型为一个产品技术驱动的大数据公司,技术上发生了哪些变化?</strong></p>
<p><strong>郭炜:</strong>变化真的蛮多的,下面的图片大概体现了易观从 2016 年到 2019 年的技术架构变迁。</p>
<p><img src="/img/bVbBUgy" alt="微信截图_20191223172410.jpg" title="微信截图_20191223172410.jpg"></p>
<p>从产品上,2016-2017 年,我们主要的产品还是易观千帆、易观万像,它本质上是易观自有的大数据平台。到 2018 年的时候,我们发现自己的大数据技术是可以帮助更多企业的,我们开始做技术输出,开始有了易观方舟,今天已经成为了包含用户行为智能分析、智能运营及技术开放的智能用户运营产品套件。</p>
<p>我们自己原来的东西特别庞大,6.8 个 PB,几百台服务器,不是每个企业都用得了,所以在 2018 年我们开始把这么复杂的大数据组件通过一个新的架构来精简,我们希望帮助企业方也都能用上好用的大数据平台。</p>
<p>这个新的架构叫 IOTA(Big Data IOTA),它的核心思路其实就是边缘计算——原先大数据都是将所有的数据存到云端去计算,但现在其实我们的手机都越来越厉害了,所以我的思路是要通过边缘计算的方式,在手机端先做好一些计算,云端只做存储和查询,这样效率就大大提高了,当年好多的大数据集群的东西浓缩在一台服务器上就可以完成。</p>
<p>把我们的自己的技术,通过新的架构迭代抽象成一个可让用户去用的产品和技术(易观方舟),这其实就 2018 年我们在做的事情。</p>
<p>到 2019 年我们又发生了变化,在过去易观方舟只做用户行为分析,今天已经实现了智能运营功能,后来我们发现很多用户希望基于自己的需求去做一些二次开发。我们把易观方舟 PaaS 化,从一个产品变成了一个平台。比如说你要做推荐,我们把相关数据通过 SDK 全都收集上来了,把非结构化数据整理好变成了结构化数据,基于这些数据你自己的分析师就可以在里边做一些推荐引擎,用户画像等等。</p>
<p>2020 年,我们会进一步把这个平台做得更稳定,希望除了我们之外,也可以有更多的开发者在上面开发一些东西。</p>
<p><strong>Nadia:所以从明年开始,其实也会做一些开发者生态的事情?</strong></p>
<p><strong>郭炜:</strong>其实我们今年也在做,易观方舟本身是一个商业产品,但其实我们有免费版本。私有化、单机服务器的这个版本我们把它免费了,叫易观方舟 Argo。在这个之前,国内现在还没有私有化部署的用户数据分析免费产品。私有化部署,数据放自己这里,用户放心。普通开发者可以直接把这个产品接入自己的后台,一台服务器,你就可以开始做用户行为分析。将来我们希望基于易观方舟 Argo,可以有各种各样的新的小东西开发出来,我们鼓励大家开发各种新玩意儿,开发完以后你可以自己用,可以把它 Share 出来我们帮你去售卖,也欢迎你基于我们的产品开源,做开源组件让大家都去用,因为易观方舟 Argo 本身就是免费的。</p>
<p><strong>Nadia:刚刚提到了 IOTA 架构可以实现更高效的数据处理速度,能否在具体应用层面为我们解释一下它的价值?</strong></p>
<p><strong>郭炜:</strong>比如说拿 SegmentFault 举例,最近 SF 某一个渠道注册留存超过七天的用户在最近一周没有登录,你想发邮件做一次召回。原先你需要提一个需求给技术,他需要跑个 SQL,SQL 跑不过可能还得跑 ETL 脚本,两三天才能给到你,公司需求多了以后或许还需要排期。但在基于 IOTA 架构的易观方舟里,你只需要勾选一些条件,不到三秒钟,这个数据马上就出来了。</p>
<p>几秒内,可能我们就要查 100 亿条数据,出一个结果,在技术上是非常难的。<strong>所以 IOTA 架构解决的核心问题是在大量数据中做一个复杂查询,秒级把这个数据查回来。</strong>那么随之而来的其实就是帮助我们<strong>将数据能力平民化</strong>,让数据分析师之外的角色也可以用这个产品去做点数据分析,而不需要大数据工程师天天去给你写脚本。</p>
<p><strong>Nadia:提到数据处理效率,您之前还曾提到过“数据河”(Data River)的概念?</strong></p>
<p><strong>郭炜:</strong>数据河其实是 IOTA 抽象化的东西。过去云厂商经常提到“数据湖”——把数据全部装进去,它的好处是把它存下来了。但你真的想去用这个数据的时候成本就会越来越高,数据越放越多,慢慢就会变成数据沼泽。我们做的其实是让数据流动起来,通过 IOTA 这样的架构,数据是直接从产生端流向消费者,不再经过数据湖,不再需要工程师去写 ETL。</p>
<p><strong>Nadia:那有什么是这三年一直坚持不变的?</strong></p>
<p><strong>郭炜:</strong>我们有两个基本点是不变的,我把它称之为技术价值观——一是<strong>开源</strong>,二是<strong>云化</strong>。</p>
<p>今年<strong>我们的开源项目 Dolphin Scheduler 入选了 Apache 基金会</strong>,但它其实不是我们第一个开源项目,我们此前已经开源了很多个项目,这是我们慢慢运营、拥抱开源的成果。</p>
<p><img src="/img/bVbBUht" alt="2.png" title="2.png"></p>
<h2>数据是有灵魂的,我将用此生去追寻</h2>
<p><strong>Nadia:现在很多公司都在谈自己是数据驱动,当然大部分都是假数据驱动,在你们的客户里面,有没有哪个公司是你们认为他真的已经把数据应用到非常好的案例?</strong></p>
<p><strong>郭炜:</strong>在我们客户里,有一家第一梯队的股份制城商行做得非常不错。其实即便是互联网公司,也不一定真的能把“数据驱动”这个词落下去。<strong>数据驱动是一个管理思维,不是一个工具能搞定的事儿。</strong></p>
<p>我们见过这家银行用北极星指标(即所有员工都要关注的唯一关键指标),这个指标对招行来讲是它的月活,他的营业员都要扛这个。使用的时候,我们能感觉到他们的 APP 确实好用,就是因为 APP 每个的点击、每个功能模块分栏目的流程,都是有明确分析路径的。这点很多互联网公司都做不到,它跟一个公司的管理阶段和成熟度是有关系的。</p>
<p><strong>Nadia:大数据这几年一直是一个热词,你个人是如何去理解大数据的?展望一下未来,它背后真正的价值是什么?</strong></p>
<p><strong>郭炜:</strong>我有一个座右铭叫<strong>数据是有灵魂的,我将用此生去追寻。</strong></p>
<p>从整个技术和行业来讲,我觉得是会越来越火的。因为人们通过各种各样数字化的手段,能把这个现实世界变成数字、信息和数据,再基于此去做相关的分析。</p>
<p>最早我做 BI 的时候,报表全都是内部 CRM 产生的。到后来大家拿 APP 的点击做分析,现在又有了人脸识别,线下动作的识别,声纹的识别……其实一个人在线下的所有行为都是可以采集到的,数据把这个世界本身数字化,那么怎么用起来呢?每一个行业、不同的赛道其实用法都不太一样,未来再加上 5G、IoT……可能大家在这会议室里面就跟黑客帝国一样,摆一个姿势、说一句话,这些服务就都到了,这些其实都是数据的应用。</p>
<p>对于大数据公司来讲挑战还蛮大的,很多数据公司后来都变成项目型公司了,他们就没有办法去做更好的增长。2016 年前后,国内大概有十几家公司都在做易观千帆同类型的产品,现在做得好的只剩两家了。易观方舟现在可能还有很多的竞争者,在这个赛道里面将来可能也只会留下几家。 对于未来,易观还是根据用户实际的需求去解决用户的问题,<strong>大数据不是一个特别容易做的赛道,每个能坚持下来公司都值得尊敬。</strong></p>
<h2>CTO的匪气:管理不是两利相衡取其重,而是两害相较取其轻</h2>
<p><strong>Nadia:最后我们来聊一聊创业这个话题,作为一个曾经一直在大平台的技术人,您是怎么看待创业的?</strong></p>
<p><strong>郭炜:</strong>创业本身九死一生,哪怕易观到现在其实依旧战战兢兢,因为其实很多时候你不知道什么是对的。<strong>创业是一件很有挑战也很有意思的事情,它的魅力和风险都来源于未知,你每天面临的情况都是未知的情况。</strong></p>
<p>对于做技术小伙伴来讲,我建议如果你还没有商业思维就先不要创业。走到创业这条路上,你会发现<strong>技术其实是创业的必要非充分条件</strong>。创业没有技术不行,光有技术也不行。因为在商业逻辑面前,你再厉害的技术,如果不能为用户提供价值也是伪技术。所以对技术小伙伴来讲,商业思维比技术能力更重要。<strong>其实不一定是技术大牛,但是你有商业思维,会和人沟通,可能就能成为一个很好的技术创业者。</strong></p>
<p><strong>Nadia:大家都叫您“郭大侠”,为什么说很多 CTO 身上一定要有匪气?</strong></p>
<p><strong>郭炜:</strong>讲一个具体的例子,很多时候大家都会觉得管理决策是择优,其实大部分选择并不是两利相衡取其优,而是两害相较取其轻——面前有两坨翔,一坨大一坨更大,你吃不吃?不吃立刻翻一倍,迟早必须吃,那就必须要杀伐决断。</p>
<p><strong>匪气在于,你可能根本看不清楚未来究竟是什么样,这两个都不太好,但你必须果敢地选一个不那么差的,然后一边鼓励团队一边被各种 PK</strong>。你要把这个扛下来,而不是文绉绉地调研一下这个再看看那个。没时间让你看,就这么干了!</p>
<p><strong>Nadia:所以这个其实可能是很多技术人能否成为一个领导者挺关键的一点。</strong></p>
<p><strong>郭炜:</strong>对,因为技术人普遍非常客观,逻辑性很强,但是做 CTO 意味着你必须经常在非常没逻辑的时候拍一个你认为不好的方案。初级管理者可能体会还没有那么深,但高级管理者一定会体会到:<strong>世间没有那么容易的事情,全都是很难办的事,只是看你选哪一个。</strong></p>
<h2>采访手记</h2>
<p>今年9月底,我第一次在易观北京办公室见到了江湖人称“郭大侠”、易观的 CTO 郭炜。历经三个月,「SegmentFault 思否」技术人访谈栏目终于在新年之际上线了。而这三个月, 秒算引擎 2.0 升级上线,易观方舟 Argo 社区收获了来自用户的开放源代码,OpenTech开放策略将通过开放的PaaS,开放的架构,开放的社区,推动一个更开放的技术生态。</p>
<p>数据行业是公认的集“脏活、累活、苦活”为一体,然而“入行”十九年,他身上却丝毫看不到疲倦的影子。热爱让他苦中作乐,两个小时聊天式的交流,从技术到创业,从个人经历到公司业务,他的真诚、严谨、热爱与侠气展露无疑。若是个晚来天欲雪的黄昏夜,真有冲动道一句“郭大侠,能饮一杯无?”</p>
<p><strong>(本文完)</strong></p>
<hr>
<blockquote>
<em>「思否技术人访谈」是 SegmentFault 上线的全新访谈类栏目,我们希望通过采访一线技术领袖,将他们真实的成长经历以及对技术的热爱传递给更多人,帮助技术人成长。</em><p><em>寻求报道:nadia@sifou.com,申请转载:pr@sifou.com</em></p>
</blockquote>