vision/CHANGELOG.md

62 lines
3.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# CHANGELOG - apigo.cc/go/vision
## v1.0.9 (2026-05-17)
- **新特性**: 内置全能命令行工具 `vision` (`cmd/vision`)。
- **功能增强**: `vision.Load` 增加多级环境探测sips, heif-convert, magick, ffmpeg完美支持 HEIC 及其网格重构解码。
- **功能增强**: `GenerateVideoPreview` 升级为动态采样算法(覆盖视频全长,限 3-8 帧),深度优化 VLM图生文解析体验。
- **功能增强**: `GenerateAudioPreview` 优化压缩策略12kbps Opus为 STT 提供极致轻量的语音摘要。
- **环境对齐**: 增加 HEIC 转换工具的自动探测与缺失警告引导。
## v1.0.8 (2026-05-15)
- **基础设施同步**: 更新核心依赖版本。
## v1.0.7 (2026-05-14)
- **依赖对齐**: 内部组件版本同步。
## v1.0.6 (2026-05-13)
- **功能完善**: 优化调色板提取精度。
## v1.0.5 (2026-05-13)
- **高级水印系统**:
-`Watermark``TextWatermark` 增加旋转角度 (`angle`) 支持。
- 新增 `TileWatermark``TileTextWatermark` 实现全图平铺水印,支持自定义间距与角度。
- **GIF 水印支持**: 为 `Animation` 结构增加全套水印方法,支持对动图所有帧批量添加水印。
- **状态确认**: 确认并完善了二维码 (`QR Code`) 与条形码 (`Barcode`) 的生成与识别能力。
## v1.0.4 (2026-05-13)
- **水印系统**: 新增 `Watermark` (图片) 和 `TextWatermark` (文字) 支持九宫格位置定义与透明度。
- **视频水印**: 扩展 `Video` 结构,支持通过 FFmpeg 一键给视频添加水印。
- **滑块验证码**: 新增 `GenerateJigsaw` 自动生成拼图路径、带槽口底图及拼图块。
- **动态验证码**: 新增 `GenerateGIFCaptcha` 生成抗 OCR 的动态 GIF 验证码。
- **功能补完**: 新增 `Canvas.Clone` 方法。
## v1.0.3 (2026-05-13)
- **性能优化**:优化 `Load` 函数,移除冗余的字符串转换,直接使用 `bytes.Reader` 进行图像解码。
- **基准测试**:新增 `BenchmarkWarpPerspective``BenchmarkPHash``BenchmarkExtractPalette` 性能测试。
- **防御性编程**:在 `Load` 函数中增加路径非空检查,提升健壮性。
- **文档更新**:在 `TEST.md` 中同步性能基准指标。
## v1.0.2 (2026-05-12)
- **文档增强**:重构 `README.md`,增加透视变换、动画合成、验证码生成等深度示例。
- **发布测试指南**:新增 `TEST.md` 明确测试覆盖范围与验证流程。
- **API 完善**:在 `Canvas` 中新增 `Invert` 滤镜支持。
## v1.0.1 (2026-05-12)
- **基础设施对齐**:全面移除原生 `os``strconv` 依赖,强制对齐 `@go` 核心设施。
- **内存优化**:使用 `go/file` 支持内存中的图像处理与序列化。
## v1.0.0 (2026-05-12)
* **Initial Release**: Complete migration and evolution from `@gojs/img`.
* **Professional Refactoring**: Removed all internal logging, switched to a pure error-driven architecture.
* **Intelligence Suite**:
* Added **QR & Barcode recognition** (decoding) via `gozxing`.
* Added **Perceptual Hashing (PHash)** for image similarity comparison.
* Added **Color Palette Extraction** and dominant color analysis.
* **Industrial Media**:
* Implemented **FFmpeg Orchestration** for real video frame extraction and synthesis.
* Built-in **Frictionless Setup** for automatic FFmpeg environment discovery.
* Enhanced **Animation Engine** for high-quality GIF generation.
* **Advanced Transformations**: Added **4-point Perspective Warping (WarpPerspective)** with bilinear interpolation.
* **Modern Text**: Support for fallback fonts and complex layout.