


软硬件协同设计
实现动态 AI 编译器
多节点与单节点一样代码编写方式

近内存分布式
内存架构优化了数据流
最大限度地提高吞吐量和效率


We founded Lemurian Labs with the sole mission of making AI accessible, affordable and efficient for everyone. We brought together experts in AI, compilers, numerical algorithms, computer arithmetic, and computer architecture to challenge the status quo. We designed a software stack, data type, and computer architecture holistically around the needs of the developer to advance AI responsibly. We focused on the needs of AI developers to ensure they have the tools they need to be more effective, and easily develop and deploy the workloads of the future.


在我十几岁的时候,我对数学有了一种感性的认识。当我看到素数、二阶方程、多项式复杂性和离散几何等术语时,我看到了beauty,purity和clarity。没有任何其他科学领域的真理能如此清晰。然而,在我年轻的时候,我的周围都是老派的工程师,他们看不起数学,认为数学太抽象,远离现实,没有用处。我迫切地想证明,这是大错特错的。
具有讽刺意味的是,当我上班时,我是唯一一个被安排在设计部门担任计算机工程师的数学家。事实证明,我是一个优秀的程序员,能够将这些技能结合起来,以独特的方式解决涉及新颖数学的问题。在工程领域,这主要是指创建新的数字格式和算法,以实现新的数学,从而提高性能和效率。
其中最有价值的例子之一就是首款全耳道(CIC)助听器的诞生。数字助听器的计算量非常大,需要高精度的数字信号处理器(DSP)来提供高质量的放大效果,而且外形小巧,功耗超低。我之前开发了一个非常漂亮、潜在价值极高的东西,即多维对数数字系统。我很快地应用了数学家的黄金原则 - "shut up and calculate"。我做了大量的数字实验,目的是揭示这个数字系统的优越性,从而在必要的尺寸和功耗范围内提供相同质量的放大效果。我将新颖的数学、算法开发和编程技能完美地结合在一起,在密码学领域实现了创新,为该领域的发展做出了无数贡献。其中一些数字创新最初看似奇特或非常规,但却经受住了时间的考验,至今仍是现代密码学的基础。
Lemurian Labs正是本着同样的精神成立的。我在Jay身上找到了共鸣,他是一位数学家和程序员,相信数学的纯粹性和力量可以重新定义计算,这次是在人工智能领域。作为 Lemurian 价值基础的新颖数学可以追溯到CIC助听器的对数系统,而 Lemurian Labs的并行自适应对数(PAL)则是数十年数学、算法和编程经验的结晶。简而言之,PAL 采用三大原则来提高性能和能效:
并行:使用不同的基数进行数字映射,将数值表示为对数
自适应:选择基数和位数,优化内存、处理带宽和精度
对数:以更高效的方式执行矩阵乘法的数学运算
PAL 的妙处在于,使用多维编码并行运算可在保持精度的同时显著提高性能。
现在,我们即将向业界推出这一产品,我知道时机已经成熟。提高性能和效率的传统方法的回报率正在迅速降低,现在,奇特和非常规的探索领域已经成熟。通过 PAL,我们解决了一个有着 250 年历史的数学难题,感觉非常棒!终于可以用数学创造美了,而且对我来说最重要的是,终于感觉到自己是有用的了。
相关阅读:
P4教程 P4应用
P4可编程SDN交换机
基于国产FPGA的智能网卡
Tofino1 | Tifino 2 |Tofino 3
基于可编程交换机的网络仿真平台


