cimicro.ai | Compute In Memory Based Heterogeneous Inference

Compute In Memory
Custom Tensor Core

Our Compute In Memory core is built using hand-crafted Custom Circuits. By bypassing standard cell libraries, our MAC units utilize an optimized Addertree structure to achieve extreme efficiency for FP4 and FP8 tensor operations.

The Power of Custom Circuit

Area Footprint -65% vs Standard Cell

Energy Efficiency 3.5x Better

Proprietary Addertree Circuitry

FP8 / FP4

Native Tensor Support

64 TOPS

Compute Performance

BF16

Precision Acceleration

FP32

Non-linear Operations

Custom Vector ISA

vsetvli t0, a0, e32, m8, ta, ma
vle32.v v8, (a1)
vfadd.vv v8, v8, v16
vse32.v v8, (a2)

Custom RISC-V
Vector Engine

Complementing our Compute In Memory engine, the specialized RISC-V Vector Engine utilizes custom instruction set extensions to handle non-linear layers and complex vector arithmetic in BF16 and FP32 formats.

Extended SIMD Instructions
Full BF16 / FP32 Pipeline

Scalable NoC Fabric

Hardware-native Broadcast and All-Reduce support. Our self-developed NoC bus enables multi-cluster synchronization between Compute In Memory nodes at near-physical limits.

Hardware All-Reduce

Dedicated hardware logic for prefix-sum and collective operations, slashing inter-cluster communication latency by 80%.

One-Shot Broadcast

Proprietary NoC fabric supports single-cycle operand broadcasting to all Compute In Memory clusters simultaneously.

Careers

JOIN THE CORE

Join us to craft the next generation of custom circuit AI silicon.

Hardware Engineering

Chip Design Engineer

CiM & Custom →

Responsibilities

Design RTL for high-throughput Compute In Memory clusters.
Optimize micro-architecture for FP4/FP8 dataflows.
Manage timing closure on advanced logic nodes.

Requirements

Expertise in Verilog/SystemVerilog and ASIC design flow.
Experience with high-speed digital logic and custom circuits.
Strong background in computer architecture.

Hardware Engineering

Chip Verification Engineer

UVM / NoC →

Responsibilities

Develop UVM testbenches for complex Compute In Memory nodes.
Ensure 100% functional and code coverage for silicon tape-out.
Execute gate-level simulations and debug complex hardware bugs.

Requirements

Proficiency in SystemVerilog, UVM, and scripting (Python).
Experience in coverage-driven verification for high-performance SoCs.
Solid understanding of AI hardware dataflows and memory.

Hardware Engineering

Circuit Design Engineer

Custom / SRAM →

Responsibilities

Design custom high-speed SRAM and register files for NPU cores.
Optimize No Buffer Die signal path integrity and power delivery.
Collaborate on advanced node custom circuit layout and analysis.

Requirements

PhD or 5+ years in custom digital circuit design.
Deep expertise in SPICE simulation and mixed-signal flows.
Expertise in advanced process nodes.

Software & AI

Quantization Algorithm Engineer

FP4 / FP8 →

Responsibilities

Research FP4/FP8 quantization for multi-billion parameter LLMs.
Develop QAT (Quantization Aware Training) pipelines for custom silicon backends.
Minimize precision loss in hardware-native Compute In Memory inference.

Requirements

Mastery of PyTorch and low-precision numerical optimization.
Solid background in Transformer and LLM architectures.
PhD in AI research or 3+ years in deep learning optimization.

Software & AI

Inference Framework Engineer

MLIR / LLVM →

Responsibilities

Optimize MLIR/LLVM-based backends for cimicro Compute In Memory engine.
Implement ultra-fast SIMD/Vector kernels for custom RISC-V cores.
Lead software-hardware co-design for high-efficiency memory management.

Requirements

Expertise in C++ and compiler infrastructure (MLIR, LLVM).
Knowledge of distributed computing and collective operations (All-Reduce).
Prior experience with GPU/NPU programming models.

Send your resume to:

hr@cimicro.ai

Latency
Optimized Silicon

Compute In Memory
Custom Tensor Core

Vertical
3D Integration

Custom RISC-V
Vector Engine

Scalable NoC Fabric

Hardware All-Reduce

One-Shot Broadcast

Data-Flow
Driven Execution

JOIN THE CORE

Chip Design Engineer

Responsibilities

Requirements

Chip Verification Engineer

Responsibilities

Requirements

Circuit Design Engineer

Responsibilities

Requirements

Quantization Algorithm Engineer

Responsibilities

Requirements

Inference Framework Engineer

Responsibilities

Requirements

Compute In Memory Custom Tensor Core

Vertical 3D Integration

Custom RISC-V Vector Engine

Scalable NoC Fabric

Hardware All-Reduce

One-Shot Broadcast

Data-Flow Driven Execution

JOIN THE CORE

Chip Design Engineer

Responsibilities

Requirements

Chip Verification Engineer

Responsibilities

Requirements

Circuit Design Engineer

Responsibilities

Requirements

Quantization Algorithm Engineer

Responsibilities

Requirements

Inference Framework Engineer

Responsibilities

Requirements

Compute In Memory
Custom Tensor Core

Vertical
3D Integration

Custom RISC-V
Vector Engine

Data-Flow
Driven Execution