unfinished llm

2024-10-29 12:04:22 +08:00 · 2024-10-29 12:04:22 +08:00 · ee2775d7fa
commit ee2775d7fa
parent b8641271be
3 changed files with 407 additions and 0 deletions
--- a/llm_unfinished/chat.go
+++ b/llm_unfinished/chat.go
@ -0,0 +1,224 @@
+package huoshan
+
+import (
+	"bytes"
+	"context"
+	"encoding/binary"
+	"io"
+	"strings"
+	"time"
+
+	"apigo.cc/ai/llm/llm"
+	"github.com/volcengine/volcengine-go-sdk/service/arkruntime/model"
+)
+
+func (lm *LLM) FastAsk(messages []llm.ChatMessage, callback func(answer string)) (string, llm.Usage, error) {
+	return lm.Ask(messages, llm.ChatConfig{
+		Model: ModelDoubaoLite32k,
+	}, callback)
+}
+
+func (lm *LLM) LongAsk(messages []llm.ChatMessage, callback func(answer string)) (string, llm.Usage, error) {
+	return lm.Ask(messages, llm.ChatConfig{
+		Model: ModelDoubaoPro256k,
+	}, callback)
+}
+
+func (lm *LLM) BatterAsk(messages []llm.ChatMessage, callback func(answer string)) (string, llm.Usage, error) {
+	return lm.Ask(messages, llm.ChatConfig{
+		Model: ModelDoubaoPro32k,
+	}, callback)
+}
+
+func (lm *LLM) BestAsk(messages []llm.ChatMessage, callback func(answer string)) (string, llm.Usage, error) {
+	return lm.Ask(messages, llm.ChatConfig{
+		Model: ModelDoubaoPro256k,
+	}, callback)
+}
+
+func (lm *LLM) MultiAsk(messages []llm.ChatMessage, callback func(answer string)) (string, llm.Usage, error) {
+	return lm.Ask(messages, llm.ChatConfig{
+		Model: ModelDoubaoLite32k,
+	}, callback)
+}
+
+func (lm *LLM) BestMultiAsk(messages []llm.ChatMessage, callback func(answer string)) (string, llm.Usage, error) {
+	return lm.Ask(messages, llm.ChatConfig{
+		Model: ModelDoubaoPro32k,
+	}, callback)
+}
+
+func (lm *LLM) CodeInterpreterAsk(messages []llm.ChatMessage, callback func(answer string)) (string, llm.Usage, error) {
+	return lm.Ask(messages, llm.ChatConfig{
+		Model: ModelDoubaoPro32k,
+		Tools: map[string]any{llm.ToolCodeInterpreter: nil},
+	}, callback)
+}
+
+func (lm *LLM) WebSearchAsk(messages []llm.ChatMessage, callback func(answer string)) (string, llm.Usage, error) {
+	return lm.Ask(messages, llm.ChatConfig{
+		Model: ModelDoubaoPro32k,
+		Tools: map[string]any{llm.ToolWebSearch: nil},
+	}, callback)
+}
+
+func (lm *LLM) Ask(messages []llm.ChatMessage, config llm.ChatConfig, callback func(answer string)) (string, llm.Usage, error) {
+	config.SetDefault(&lm.config.ChatConfig)
+
+	req := model.ChatCompletionRequest{
+		Model: config.GetModel(),
+	}
+
+	req.Messages = make([]*model.ChatCompletionMessage, len(messages))
+	for i, msg := range messages {
+		var contents []*model.ChatCompletionMessageContentPart
+		if msg.Contents != nil {
+			contents = make([]*model.ChatCompletionMessageContentPart, len(msg.Contents))
+			for j, inPart := range msg.Contents {
+				part := model.ChatCompletionMessageContentPart{}
+				part.Type = model.ChatCompletionMessageContentPartType(NameMap[inPart.Type])
+				switch inPart.Type {
+				case llm.TypeText:
+					part.Text = inPart.Content
+				case llm.TypeImage:
+					part.ImageURL = &model.ChatMessageImageURL{URL: inPart.Content}
+					//case llm.TypeVideo:
+					//	part.VideoURL = &model.URLItem{URL: inPart.Content}
+				}
+				contents[j] = &part
+			}
+		}
+		if len(contents) == 1 && contents[0].Type == llm.TypeText {
+			req.Messages[i] = &model.ChatCompletionMessage{
+				Role: NameMap[msg.Role],
+				Content: &model.ChatCompletionMessageContent{
+					StringValue: &contents[0].Text,
+				},
+			}
+		} else {
+			req.Messages[i] = &model.ChatCompletionMessage{
+				Role: NameMap[msg.Role],
+				Content: &model.ChatCompletionMessageContent{
+					ListValue: contents,
+				},
+			}
+		}
+	}
+
+	// tools := config.GetTools()
+	// if len(tools) > 0 {
+	// 	req.Tools = make([]*model.Tool, 0)
+	// 	for name := range tools {
+	// 		switch name {
+	// 		case llm.ToolCodeInterpreter:
+	// 			req.Tools = append(req.Tools, &model.Tool{
+	// 				Type: ,
+	// 			})
+	// 			// cc.AddTool(zhipu.ChatCompletionToolCodeInterpreter{})
+	// 		case llm.ToolWebSearch:
+	// 			// cc.AddTool(zhipu.ChatCompletionToolWebBrowser{})
+	// 		}
+	// 	}
+	// }
+	if config.GetMaxTokens() != 0 {
+		req.MaxTokens = config.GetMaxTokens()
+	}
+	if config.GetTemperature() != 0 {
+		req.Temperature = float32(config.GetTemperature())
+	}
+	if config.GetTopP() != 0 {
+		req.TopP = float32(config.GetTopP())
+	}
+
+	c := lm.getChatClient()
+	t1 := time.Now().UnixMilli()
+	if callback != nil {
+		stream, err := c.CreateChatCompletionStream(context.Background(), req)
+		if err != nil {
+			return "", llm.Usage{}, err
+		}
+		out := make([]string, 0)
+		var outErr error
+		usage := llm.Usage{}
+		for {
+			recv, err := stream.Recv()
+			usage.AskTokens += int64(recv.Usage.PromptTokens)
+			usage.AnswerTokens += int64(recv.Usage.CompletionTokens)
+			usage.TotalTokens += int64(recv.Usage.TotalTokens)
+			if err == io.EOF {
+				break
+			}
+			if err != nil {
+				outErr = err
+				break
+			}
+
+			if len(recv.Choices) > 0 {
+				for _, ch := range recv.Choices {
+					text := ch.Delta.Content
+					out = append(out, text)
+					callback(text)
+				}
+			}
+		}
+		stream.Close()
+		usage.UsedTime = time.Now().UnixMilli() - t1
+		return strings.Join(out, ""), usage, outErr
+	} else {
+		r, err := c.CreateChatCompletion(context.Background(), req)
+		if err != nil {
+			return "", llm.Usage{}, err
+		}
+		t2 := time.Now().UnixMilli() - t1
+		results := make([]string, 0)
+		if r.Choices != nil {
+			for _, ch := range r.Choices {
+				results = append(results, *ch.Message.Content.StringValue)
+			}
+		}
+		return strings.Join(results, ""), llm.Usage{
+			AskTokens:    int64(r.Usage.PromptTokens),
+			AnswerTokens: int64(r.Usage.CompletionTokens),
+			TotalTokens:  int64(r.Usage.TotalTokens),
+			UsedTime:     t2,
+		}, nil
+
+	}
+}
+
+func (lm *LLM) FastEmbedding(text string) ([]byte, llm.Usage, error) {
+	return lm.Embedding(text, ModelDoubaoEmbedding)
+}
+
+func (lm *LLM) BestEmbedding(text string) ([]byte, llm.Usage, error) {
+	return lm.Embedding(text, ModelDoubaoEmbeddingLarge)
+}
+
+func (lm *LLM) Embedding(text, modelName string) ([]byte, llm.Usage, error) {
+	c := lm.getChatClient()
+	// cc := c.Embedding(modelName)
+	req := model.EmbeddingRequestStrings{
+		Input: []string{text},
+		Model: modelName,
+	}
+	t1 := time.Now().UnixMilli()
+	if r, err := c.CreateEmbeddings(context.Background(), req); err == nil {
+		t2 := time.Now().UnixMilli() - t1
+		buf := new(bytes.Buffer)
+		if r.Data != nil {
+			for _, ch := range r.Data {
+				for _, v := range ch.Embedding {
+					_ = binary.Write(buf, binary.LittleEndian, float32(v))
+				}
+			}
+		}
+		return buf.Bytes(), llm.Usage{
+			AskTokens:    int64(r.Usage.PromptTokens),
+			AnswerTokens: int64(r.Usage.CompletionTokens),
+			TotalTokens:  int64(r.Usage.TotalTokens),
+			UsedTime:     t2,
+		}, nil
+	} else {
+		return nil, llm.Usage{}, err
+	}
+}
--- a/llm_unfinished/config.go
+++ b/llm_unfinished/config.go
@ -0,0 +1,96 @@
+package huoshan
+
+import (
+	"strings"
+
+	"apigo.cc/ai/llm/llm"
+	"github.com/volcengine/volc-sdk-golang/service/visual"
+	"github.com/volcengine/volcengine-go-sdk/service/arkruntime"
+	"github.com/volcengine/volcengine-go-sdk/service/arkruntime/model"
+)
+
+type LLM struct {
+	config llm.Config
+}
+
+var NameMap = map[string]string{
+	llm.TypeText:  string(model.ChatCompletionMessageContentPartTypeText),
+	llm.TypeImage: string(model.ChatCompletionMessageContentPartTypeImageURL),
+	//llm.TypeVideo:     string(model.ChatCompletionMessageContentPartTypeVideoURL),
+	llm.RoleSystem:    model.ChatMessageRoleSystem,
+	llm.RoleUser:      model.ChatMessageRoleUser,
+	llm.RoleAssistant: model.ChatMessageRoleAssistant,
+	llm.RoleTool:      model.ChatMessageRoleTool,
+}
+
+const (
+	ModelDoubaoLite4k                 = "Doubao-lite-4k"
+	ModelDoubaoLite32k                = "Doubao-lite-32k"
+	ModelDoubaoLite128k               = "Doubao-lite-128k"
+	ModelDoubaoPro4k                  = "Doubao-pro-4k"
+	ModelDoubaoPro32k                 = "Doubao-pro-32k"
+	ModelDoubaoPro128k                = "Doubao-pro-128k"
+	ModelDoubaoPro256k                = "Doubao-pro-256k"
+	ModelDoubaoEmbedding              = "Doubao-embedding"
+	ModelDoubaoEmbeddingLarge         = "Doubao-embedding-large"
+	ModelT2I2L                        = "high_aes_general_v20_L:general_v2.0_L"
+	ModelT2I2S                        = "high_aes_general_v20:general_v2.0"
+	ModelT2IXL                        = "t2i_xl_sft"
+	ModelI2IXL                        = "i2i_xl_sft"
+	ModelT2I14                        = "high_aes_general_v14"
+	ModelI2I14IP                      = "high_aes_general_v14_ip_keep"
+	ModelAnime13                      = "high_aes:anime_v1.3"
+	ModelAnime131                     = "high_aes:anime_v1.3.1"
+	ModelPhotoverseAmericanComics     = "img2img_photoverse_american_comics"    // 美漫风格
+	ModelPhotoverseExecutiveIDPhoto   = "img2img_photoverse_executive_ID_photo" // 商务证件照
+	ModelPhotoverse3dWeird            = "img2img_photoverse_3d_weird"           // 3d人偶
+	ModelPhotoverseCyberpunk          = "img2img_photoverse_cyberpunk"          // 赛博朋克
+	ModelXiezhenGubao                 = "img2img_xiezhen_gubao"                 // 古堡
+	ModelXiezhenBabiNiuzai            = "img2img_xiezhen_babi_niuzai"           // 芭比牛仔
+	ModelXiezhenBathrobe              = "img2img_xiezhen_bathrobe"              // 浴袍风格
+	ModelXiezhenButterflyMachin       = "img2img_xiezhen_butterfly_machin"      // 蝴蝶机械
+	ModelXiezhenZhichangzhengjianzhao = "img2img_xiezhen_zhichangzhengjianzhao" // 职场证件照
+	ModelXiezhenChristmas             = "img2img_xiezhen_christmas"             // 圣诞
+	ModelXiezhenDessert               = "img2img_xiezhen_dessert"               // 美式甜点师
+	ModelXiezhenOldMoney              = "img2img_xiezhen_old_money"             // old money
+	ModelXiezhenSchool                = "img2img_xiezhen_school"                // 最美校园
+)
+
+func (lm *LLM) Support() llm.Support {
+	return llm.Support{
+		Ask:                    true,
+		AskWithImage:           true,
+		AskWithVideo:           false,
+		AskWithCodeInterpreter: false,
+		AskWithWebSearch:       false,
+		MakeImage:              true,
+		MakeVideo:              false,
+		Models:                 []string{ModelDoubaoLite4k, ModelDoubaoLite32k, ModelDoubaoLite128k, ModelDoubaoPro4k, ModelDoubaoPro32k, ModelDoubaoPro128k, ModelDoubaoPro256k, ModelDoubaoEmbedding, ModelDoubaoEmbeddingLarge, ModelT2I2L, ModelT2I2S, ModelT2IXL, ModelI2IXL, ModelT2I14, ModelI2I14IP, ModelAnime13, ModelAnime131, ModelPhotoverseAmericanComics, ModelPhotoverseExecutiveIDPhoto, ModelPhotoverse3dWeird, ModelPhotoverseCyberpunk, ModelXiezhenGubao, ModelXiezhenBabiNiuzai, ModelXiezhenBathrobe, ModelXiezhenButterflyMachin, ModelXiezhenZhichangzhengjianzhao, ModelXiezhenChristmas, ModelXiezhenDessert, ModelXiezhenOldMoney, ModelXiezhenSchool},
+	}
+}
+
+func (lm *LLM) getChatClient() *arkruntime.Client {
+	opt := make([]arkruntime.ConfigOption, 0)
+	if lm.config.Endpoint != "" {
+		opt = append(opt, arkruntime.WithBaseUrl(lm.config.Endpoint))
+	}
+	return arkruntime.NewClientWithAkSk(strings.SplitN(lm.config.ApiKey, ",", 2)[0], opt...)
+}
+
+func (lm *LLM) getGCClient() *visual.Visual {
+	keys := strings.SplitN(lm.config.ApiKey, ",", 2)
+	if len(keys) == 1 {
+		keys = append(keys, "")
+	}
+	vis := visual.NewInstance()
+	vis.Client.SetAccessKey(keys[0])
+	vis.Client.SetSecretKey(keys[1])
+	return vis
+}
+
+// 因为火山平台的配置过于繁琐（每个模型都要创建单独的endpoint，所以暂时放弃对豆包大模型的支持）
+// func init() {
+// 	llm.Register("huoshan", func(config llm.Config) llm.LLM {
+// 		return &LLM{config: config}
+// 	})
+// }
--- a/llm_unfinished/gc.go
+++ b/llm_unfinished/gc.go
@ -0,0 +1,87 @@
+package huoshan
+
+import (
+	"errors"
+	"strings"
+	"time"
+
+	"apigo.cc/ai/llm/llm"
+	"github.com/ssgo/u"
+	"github.com/volcengine/volc-sdk-golang/service/visual/model"
+)
+
+func (lm *LLM) FastMakeImage(prompt string, config llm.GCConfig) ([]string, llm.Usage, error) {
+	config.Model = ModelT2I14
+	if config.Ref != "" {
+		config.Model = ModelI2I14IP
+	}
+	return lm.MakeImage(prompt, config)
+}
+
+func (lm *LLM) BestMakeImage(prompt string, config llm.GCConfig) ([]string, llm.Usage, error) {
+	config.Model = ModelT2IXL
+	if config.Ref != "" {
+		config.Model = ModelI2IXL
+	}
+	return lm.MakeImage(prompt, config)
+}
+
+func (lm *LLM) MakeImage(prompt string, config llm.GCConfig) ([]string, llm.Usage, error) {
+	config.SetDefault(&lm.config.GCConfig)
+	modelA := strings.SplitN(config.GetModel(), ":", 2)
+	sizeA := strings.SplitN(config.GetSize(), "x", 2)
+	if len(sizeA) == 1 {
+		sizeA = append(sizeA, sizeA[0])
+	}
+	ref := config.GetRef()
+	vis := lm.getGCClient()
+	data := map[string]any{
+		"req_key":    modelA[0],
+		"prompt":     prompt,
+		"width":      u.Int(sizeA[0]),
+		"height":     u.Int(sizeA[1]),
+		"return_url": true,
+	}
+	if len(modelA) > 1 {
+		data["model_version"] = modelA[1]
+	}
+	// TODO llm 支持动态额外参数
+
+	t1 := time.Now().UnixMilli()
+	var resp *model.VisualPubResult
+	var status int
+	var err error
+	if ref == "" {
+		resp, status, err = vis.Text2ImgXLSft(data)
+	} else {
+		if strings.Contains(ref, "://") {
+			data["image_url"] = []string{ref}
+		} else {
+			data["binary_data_base64"] = []string{ref}
+		}
+		resp, status, err = vis.Img2ImgXLSft(data)
+	}
+	t2 := time.Now().UnixMilli() - t1
+
+	if err != nil {
+		return nil, llm.Usage{}, err
+	}
+	if status != 200 {
+		return nil, llm.Usage{}, errors.New(resp.Message)
+	}
+	return resp.Data.ImageUrls, llm.Usage{
+		UsedTime: t2,
+	}, nil
+}
+
+func (lm *LLM) FastMakeVideo(prompt string, config llm.GCConfig) ([]string, []string, llm.Usage, error) {
+	return lm.MakeVideo(prompt, config)
+}
+
+func (lm *LLM) BestMakeVideo(prompt string, config llm.GCConfig) ([]string, []string, llm.Usage, error) {
+	return lm.MakeVideo(prompt, config)
+}
+
+func (lm *LLM) MakeVideo(prompt string, config llm.GCConfig) ([]string, []string, llm.Usage, error) {
+	return nil, nil, llm.Usage{}, errors.New("not support")
+}