xserv

Go to file

Gahow Wang a83971fa25 phase 2: tensor abstraction layer

- DType enum (F32, F16, BF16) with TensorDType trait
- Shape utilities: contiguous_strides, broadcast_shape, broadcast_strides
- Storage with Arc reference counting (CPU Vec<u8> or GPU GpuBuffer)
- Device enum (Cpu, Cuda(id)) with to_device transfer
- Tensor type with strided layout: reshape, transpose, squeeze, unsqueeze
- contiguous() copies non-contiguous views to contiguous layout
- from_slice, zeros, ones constructors
- as_slice<T> for typed CPU read access, data_ptr for GPU kernel launch
- CPU↔GPU roundtrip verified
- All 27 tests pass (12 cuda + 4 shape + 11 tensor)

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-05-21 19:45:22 +08:00

crates

phase 2: tensor abstraction layer

2026-05-21 19:45:22 +08:00

csrc/test

phase 0+1: project scaffold + xserv-cuda crate

2026-05-21 18:40:22 +08:00

docs

phase 0+1: project scaffold + xserv-cuda crate

2026-05-21 18:40:22 +08:00

tools

phase 0+1: project scaffold + xserv-cuda crate