fix subscription usage increasing when request is error, update claude models

2025-05-29 01:40:17 +09:00 · 2023-11-03 17:37:57 +08:00 · 2023-11-03 17:37:57 +08:00 · a22f14a123
commit a22f14a123
parent ebd8a6f1c6
26 changed files with 183 additions and 287 deletions
--- a/README.md
+++ b/README.md
@ -64,8 +64,8 @@
    - GPT-3.5-Turbo-Instruct
    - GPT-4 (_0314_, _0613_)
    - GPT-4-32k (_0314_, _0613_)
-    - GPT-4-Reverse (_gpt-4_, _**gpt-4v**_)
+    - GPT-4-Reverse (_gpt-4_, _**gpt-4v**_, _**dalle3**_)
-    - DALL-E
+    - DALL-E 2
 - Claude
    - Slack-Claude (unstable)
    - Claude-2
@ -83,6 +83,13 @@
  - Creative
  - Balanced
  - Precise
 - ChatGLM
  - Pro
  - Std
  - Lite
 - DashScope Tongyi
  - Qwen Plus (net)
  - Qwen Turbo (net)
 - More models are under development...
--- a/adapter/adapter.go
+++ b/adapter/adapter.go
@ -4,6 +4,7 @@ import (
 	"chat/adapter/bing"
 	"chat/adapter/claude"
 	"chat/adapter/dashscope"
 	"chat/adapter/oneapi"
 	"chat/adapter/palm2"
 	"chat/adapter/slack"
 	"chat/adapter/zhipuai"
@ -20,7 +21,10 @@ type ChatProps struct {
 }
 func NewChatRequest(props *ChatProps, hook globals.Hook) error {
-	if globals.IsChatGPTModel(props.Model) {
+	if oneapi.IsHit(props.Model) {
 		return oneapi.Handle(props, hook)
 	} else if globals.IsChatGPTModel(props.Model) {
 		return createRetryChatGPTPool(props, hook)
 	} else if globals.IsClaudeModel(props.Model) {
--- a/adapter/chatgpt/chat.go
+++ b/adapter/chatgpt/chat.go
@ -5,7 +5,6 @@ import (
 	"chat/globals"
 	"chat/utils"
 	"fmt"
 	"github.com/spf13/viper"
 	"strings"
 )
@ -135,41 +134,3 @@ func (c *ChatInstance) CreateStreamChatRequest(props *ChatProps, callback global
 		},
 	)
 }
 func (c *ChatInstance) Test() bool {
 	result, err := c.CreateChatRequest(&ChatProps{
 		Model:   globals.GPT3Turbo,
 		Message: []globals.Message{{Role: "user", Content: "hi"}},
 		Token:   1,
 	})
 	if err != nil {
 		fmt.Println(fmt.Sprintf("%s: test failed (%s)", c.GetApiKey(), err.Error()))
 	}
 	return err == nil && len(result) > 0
 }
 func FilterKeys(v string) []string {
 	endpoint := viper.GetString(fmt.Sprintf("openai.%s.endpoint", v))
 	keys := strings.Split(viper.GetString(fmt.Sprintf("openai.%s.apikey", v)), "|")
 	return FilterKeysNative(endpoint, keys)
 }
 func FilterKeysNative(endpoint string, keys []string) []string {
 	stack := make(chan string, len(keys))
 	for _, key := range keys {
 		go func(key string) {
 			instance := NewChatInstance(endpoint, key)
 			stack <- utils.Multi[string](instance.Test(), key, "")
 		}(key)
 	}
 	var result []string
 	for i := 0; i < len(keys); i++ {
 		if res := <-stack; res != "" {
 			result = append(result, res)
 		}
 	}
 	return result
 }
--- a/adapter/chatgpt/struct.go
+++ b/adapter/chatgpt/struct.go
@ -48,12 +48,10 @@ func NewChatInstanceFromConfig(v string) *ChatInstance {
 func NewChatInstanceFromModel(props *InstanceProps) *ChatInstance {
 	switch props.Model {
-	case globals.GPT4, globals.GPT40314, globals.GPT40613:
+	case globals.GPT4, globals.GPT40314, globals.GPT40613,
 		globals.GPT432k, globals.GPT432k0613, globals.GPT432k0314:
 		return NewChatInstanceFromConfig("gpt4")
 	case globals.GPT432k, globals.GPT432k0613, globals.GPT432k0314:
 		return NewChatInstanceFromConfig("32k")
 	case globals.GPT4Vision, globals.Dalle3:
 		return NewChatInstanceFromConfig("reverse")
--- a/adapter/chatgpt/test.go
+++ b/adapter/chatgpt/test.go
@ -0,0 +1,47 @@
 package chatgpt
 import (
 	"chat/globals"
 	"chat/utils"
 	"fmt"
 	"github.com/spf13/viper"
 	"strings"
 )
 func (c *ChatInstance) Test() bool {
 	result, err := c.CreateChatRequest(&ChatProps{
 		Model:   globals.GPT3Turbo,
 		Message: []globals.Message{{Role: "user", Content: "hi"}},
 		Token:   1,
 	})
 	if err != nil {
 		fmt.Println(fmt.Sprintf("%s: test failed (%s)", c.GetApiKey(), err.Error()))
 	}
 	return err == nil && len(result) > 0
 }
 func FilterKeys(v string) []string {
 	endpoint := viper.GetString(fmt.Sprintf("openai.%s.endpoint", v))
 	keys := strings.Split(viper.GetString(fmt.Sprintf("openai.%s.apikey", v)), "|")
 	return FilterKeysNative(endpoint, keys)
 }
 func FilterKeysNative(endpoint string, keys []string) []string {
 	stack := make(chan string, len(keys))
 	for _, key := range keys {
 		go func(key string) {
 			instance := NewChatInstance(endpoint, key)
 			stack <- utils.Multi[string](instance.Test(), key, "")
 		}(key)
 	}
 	var result []string
 	for i := 0; i < len(keys); i++ {
 		if res := <-stack; res != "" {
 			result = append(result, res)
 		}
 	}
 	return result
 }
--- a/adapter/oneapi/chat.go
+++ b/adapter/oneapi/chat.go
@ -1,11 +1,10 @@
-package chatgpt
+package oneapi
 import "C"
 import (
 	"chat/globals"
 	"chat/utils"
 	"fmt"
 	"github.com/spf13/viper"
 	"strings"
 )
@ -15,36 +14,11 @@ type ChatProps struct {
 	Token   int
 }
-func (c *ChatInstance) GetChatEndpoint(props *ChatProps) string {
+func (c *ChatInstance) GetChatEndpoint() string {
 	if props.Model == globals.GPT3TurboInstruct {
 		return fmt.Sprintf("%s/v1/completions", c.GetEndpoint())
 	}
 	return fmt.Sprintf("%s/v1/chat/completions", c.GetEndpoint())
 }
 func (c *ChatInstance) GetCompletionPrompt(messages []globals.Message) string {
 	result := ""
 	for _, message := range messages {
 		result += fmt.Sprintf("%s: %s\n", message.Role, message.Content)
 	}
 	return result
 }
 func (c *ChatInstance) GetChatBody(props *ChatProps, stream bool) interface{} {
 	if props.Model == globals.GPT3TurboInstruct {
 		// for completions
 		return utils.Multi[interface{}](props.Token != -1, CompletionRequest{
 			Model:    props.Model,
 			Prompt:   c.GetCompletionPrompt(props.Message),
 			MaxToken: props.Token,
 			Stream:   stream,
 		}, CompletionWithInfinity{
 			Model:  props.Model,
 			Prompt: c.GetCompletionPrompt(props.Message),
 			Stream: stream,
 		})
 	}
 	if props.Token != -1 {
 		return ChatRequest{
 			Model:    props.Model,
@ -61,42 +35,41 @@ func (c *ChatInstance) GetChatBody(props *ChatProps, stream bool) interface{} {
 	}
 }
-// CreateChatRequest is the native http request body for chatgpt
+// CreateChatRequest is the native http request body for oneapi
 func (c *ChatInstance) CreateChatRequest(props *ChatProps) (string, error) {
 	res, err := utils.Post(
-		c.GetChatEndpoint(props),
+		c.GetChatEndpoint(),
 		c.GetHeader(),
 		c.GetChatBody(props, false),
 	)
 	if err != nil || res == nil {
-		return "", fmt.Errorf("chatgpt error: %s", err.Error())
+		return "", fmt.Errorf("oneapi error: %s", err.Error())
 	}
 	data := utils.MapToStruct[ChatResponse](res)
 	if data == nil {
-		return "", fmt.Errorf("chatgpt error: cannot parse response")
+		return "", fmt.Errorf("oneapi error: cannot parse response")
 	} else if data.Error.Message != "" {
-		return "", fmt.Errorf("chatgpt error: %s", data.Error.Message)
+		return "", fmt.Errorf("oneapi error: %s", data.Error.Message)
 	}
 	return data.Choices[0].Message.Content, nil
 }
-// CreateStreamChatRequest is the stream response body for chatgpt
+// CreateStreamChatRequest is the stream response body for oneapi
 func (c *ChatInstance) CreateStreamChatRequest(props *ChatProps, callback globals.Hook) error {
 	buf := ""
 	instruct := props.Model == globals.GPT3TurboInstruct
 	return utils.EventSource(
 		"POST",
-		c.GetChatEndpoint(props),
+		c.GetChatEndpoint(),
 		c.GetHeader(),
 		c.GetChatBody(props, true),
 		func(data string) error {
-			data, err := c.ProcessLine(instruct, buf, data)
+			data, err := c.ProcessLine(buf, data)
 			if err != nil {
-				if strings.HasPrefix(err.Error(), "chatgpt error") {
+				if strings.HasPrefix(err.Error(), "oneapi error") {
 					return err
 				}
@ -115,41 +88,3 @@ func (c *ChatInstance) CreateStreamChatRequest(props *ChatProps, callback global
 		},
 	)
 }
 func (c *ChatInstance) Test() bool {
 	result, err := c.CreateChatRequest(&ChatProps{
 		Model:   globals.GPT3Turbo,
 		Message: []globals.Message{{Role: "user", Content: "hi"}},
 		Token:   1,
 	})
 	if err != nil {
 		fmt.Println(fmt.Sprintf("%s: test failed (%s)", c.GetApiKey(), err.Error()))
 	}
 	return err == nil && len(result) > 0
 }
 func FilterKeys(v string) []string {
 	endpoint := viper.GetString(fmt.Sprintf("openai.%s.endpoint", v))
 	keys := strings.Split(viper.GetString(fmt.Sprintf("openai.%s.apikey", v)), "|")
 	return FilterKeysNative(endpoint, keys)
 }
 func FilterKeysNative(endpoint string, keys []string) []string {
 	stack := make(chan string, len(keys))
 	for _, key := range keys {
 		go func(key string) {
 			instance := NewChatInstance(endpoint, key)
 			stack <- utils.Multi[string](instance.Test(), key, "")
 		}(key)
 	}
 	var result []string
 	for i := 0; i < len(keys); i++ {
 		if res := <-stack; res != "" {
 			result = append(result, res)
 		}
 	}
 	return result
 }
--- a/adapter/oneapi/globals.go
+++ b/adapter/oneapi/globals.go
@ -0,0 +1,32 @@
 package oneapi
 import (
 	"chat/globals"
 )
 var HitModels = []string{
 	globals.Claude2, globals.Claude2100k,
 }
 func (c *ChatInstance) Process(data string) string {
 	return data
 }
 func (c *ChatInstance) FormatMessage(message []globals.Message) []globals.Message {
 	return message
 }
 func (c *ChatInstance) FormatModel(model string) string {
 	return model
 }
 func (c *ChatInstance) GetToken(model string) int {
 	switch model {
 	case globals.Claude2:
 		return 5000
 	case globals.Claude2100k:
 		return 50000
 	default:
 		return 2500
 	}
 }
--- a/adapter/oneapi/handler.go
+++ b/adapter/oneapi/handler.go
@ -0,0 +1,30 @@
 package oneapi
 import (
 	"chat/globals"
 	"chat/utils"
 )
 type AdapterProps struct {
 	Model    string
 	Plan     bool
 	Infinity bool
 	Message  []globals.Message
 	Token    int
 }
 func HandleRequest(props *AdapterProps, hook globals.Hook) error {
 	instance := NewChatInstanceFromConfig()
 	return instance.CreateStreamChatRequest(&ChatProps{
 		Model:   instance.FormatModel(props.Model),
 		Message: instance.FormatMessage(props.Message),
 		Token:   utils.Multi(props.Token == 0, instance.GetToken(props.Model), props.Token),
 	}, func(data string) error {
 		return hook(instance.Process(data))
 	})
 }
 func Handle(props interface{}, hook globals.Hook) error {
 	conv := utils.MapToStruct[AdapterProps](props)
 	return HandleRequest(conv, hook)
 }
--- a/adapter/oneapi/processor.go
+++ b/adapter/oneapi/processor.go
@ -1,4 +1,4 @@
-package chatgpt
+package oneapi
 import (
 	"chat/globals"
@ -54,21 +54,6 @@ func processChatResponse(data string) *ChatStreamResponse {
 	return nil
 }
 func processCompletionResponse(data string) *CompletionResponse {
 	if strings.HasPrefix(data, "{") {
 		var form *CompletionResponse
 		if form = utils.UnmarshalForm[CompletionResponse](data); form != nil {
 			return form
 		}
 		if form = utils.UnmarshalForm[CompletionResponse](data[:len(data)-1]); form != nil {
 			return form
 		}
 	}
 	return nil
 }
 func processChatErrorResponse(data string) *ChatStreamErrorResponse {
 	if strings.HasPrefix(data, "{") {
 		var form *ChatStreamErrorResponse
@ -98,38 +83,23 @@ func getChoices(form *ChatStreamResponse) string {
 	return form.Data.Choices[0].Delta.Content
 }
-func getCompletionChoices(form *CompletionResponse) string {
+func (c *ChatInstance) ProcessLine(buf, data string) (string, error) {
 	if len(form.Data.Choices) == 0 {
 		return ""
 	}
 	return form.Data.Choices[0].Text
 }
 func (c *ChatInstance) ProcessLine(instruct bool, buf, data string) (string, error) {
 	item := processFormat(buf + data)
 	if isDone(item) {
 		return "", nil
 	}
 	if form := processChatResponse(item); form == nil {
 		if instruct {
 			// legacy support
 			if completion := processCompletionResponse(item); completion != nil {
 				return getCompletionChoices(completion), nil
 			}
 		}
 		// recursive call
 		if len(buf) > 0 {
-			return c.ProcessLine(instruct, "", buf+item)
+			return c.ProcessLine("", buf+item)
 		}
 		if err := processChatErrorResponse(item); err == nil {
-			globals.Warn(fmt.Sprintf("chatgpt error: cannot parse response: %s", item))
+			globals.Warn(fmt.Sprintf("oneapi error: cannot parse response: %s", item))
 			return data, errors.New("parser error: cannot parse response")
 		} else {
-			return "", fmt.Errorf("chatgpt error: %s (type: %s)", err.Data.Error.Message, err.Data.Error.Type)
+			return "", fmt.Errorf("oneapi error: %s (type: %s)", err.Data.Error.Message, err.Data.Error.Type)
 		}
 	} else {
--- a/adapter/oneapi/struct.go
+++ b/adapter/oneapi/struct.go
@ -1,7 +1,6 @@
-package chatgpt
+package oneapi
 import (
 	"chat/globals"
 	"chat/utils"
 	"fmt"
 	"github.com/spf13/viper"
@ -39,31 +38,13 @@ func NewChatInstance(endpoint, apiKey string) *ChatInstance {
 	}
 }
-func NewChatInstanceFromConfig(v string) *ChatInstance {
+func NewChatInstanceFromConfig() *ChatInstance {
 	return NewChatInstance(
-		viper.GetString(fmt.Sprintf("openai.%s.endpoint", v)),
+		viper.GetString("oneapi.endpoint"),
-		utils.GetRandomKey(viper.GetString(fmt.Sprintf("openai.%s.apikey", v))),
+		viper.GetString("oneapi.apikey"),
 	)
 }
-func NewChatInstanceFromModel(props *InstanceProps) *ChatInstance {
+func IsHit(model string) bool {
-	switch props.Model {
+	return utils.Contains[string](model, HitModels)
 	case globals.GPT4, globals.GPT40314, globals.GPT40613:
 		return NewChatInstanceFromConfig("gpt4")
 	case globals.GPT432k, globals.GPT432k0613, globals.GPT432k0314:
 		return NewChatInstanceFromConfig("32k")
 	case globals.GPT4Vision, globals.Dalle3:
 		return NewChatInstanceFromConfig("reverse")
 	case globals.GPT3Turbo, globals.GPT3TurboInstruct, globals.GPT3Turbo0613, globals.GPT3Turbo0301,
 		globals.GPT3Turbo16k, globals.GPT3Turbo16k0301, globals.GPT3Turbo16k0613:
 		if props.Plan {
 			return NewChatInstanceFromConfig("subscribe")
 		}
 		return NewChatInstanceFromConfig("gpt3")
 	default:
 		return NewChatInstanceFromConfig("gpt3")
 	}
 }
--- a/adapter/oneapi/types.go
+++ b/adapter/oneapi/types.go
@ -1,8 +1,8 @@
-package chatgpt
+package oneapi
 import "chat/globals"
-// ChatRequest is the request body for chatgpt
+// ChatRequest is the request body for oneapi
 type ChatRequest struct {
 	Model    string            `json:"model"`
 	Messages []globals.Message `json:"messages"`
@ -16,21 +16,7 @@ type ChatRequestWithInfinity struct {
 	Stream   bool              `json:"stream"`
 }
-// CompletionRequest ChatRequest is the request body for chatgpt completion
+// ChatResponse is the native http request body for oneapi
 type CompletionRequest struct {
 	Model    string `json:"model"`
 	Prompt   string `json:"prompt"`
 	MaxToken int    `json:"max_tokens"`
 	Stream   bool   `json:"stream"`
 }
 type CompletionWithInfinity struct {
 	Model  string `json:"model"`
 	Prompt string `json:"prompt"`
 	Stream bool   `json:"stream"`
 }
 // ChatResponse is the native http request body for chatgpt
 type ChatResponse struct {
 	ID      string `json:"id"`
 	Object  string `json:"object"`
@ -46,7 +32,7 @@ type ChatResponse struct {
 	} `json:"error"`
 }
-// ChatStreamResponse is the stream response body for chatgpt
+// ChatStreamResponse is the stream response body for oneapi
 type ChatStreamResponse struct {
 	ID      string `json:"id"`
 	Object  string `json:"object"`
@ -62,20 +48,6 @@ type ChatStreamResponse struct {
 	} `json:"data"`
 }
 // CompletionResponse is the native http request body / stream response body for chatgpt completion
 type CompletionResponse struct {
 	ID      string `json:"id"`
 	Object  string `json:"object"`
 	Created int64  `json:"created"`
 	Model   string `json:"model"`
 	Data    struct {
 		Choices []struct {
 			Text  string `json:"text"`
 			Index int    `json:"index"`
 		} `json:"choices"`
 	} `json:"data"`
 }
 type ChatStreamErrorResponse struct {
 	Data struct {
 		Error struct {
@ -84,27 +56,3 @@ type ChatStreamErrorResponse struct {
 		} `json:"error"`
 	} `json:"data"`
 }
 type ImageSize string
 // ImageRequest is the request body for chatgpt dalle image generation
 type ImageRequest struct {
 	Prompt string    `json:"prompt"`
 	Size   ImageSize `json:"size"`
 	N      int       `json:"n"`
 }
 type ImageResponse struct {
 	Data []struct {
 		Url string `json:"url"`
 	} `json:"data"`
 	Error struct {
 		Message string `json:"message"`
 	} `json:"error"`
 }
 var (
 	ImageSize256  ImageSize = "256x256"
 	ImageSize512  ImageSize = "512x512"
 	ImageSize1024 ImageSize = "1024x1024"
 )
--- a/adapter/request.go
+++ b/adapter/request.go
@ -32,21 +32,6 @@ func retryChatGPTPool(props *ChatProps, hook globals.Hook, retry int) error {
 		),
 	}, hook)
 	if globals.IsGPT4NativeModel(props.Model) && IsAvailableError(err) {
 		if !strings.Contains(err.Error(), "429") {
 			// not rate limited
 			return chatgpt.NewChatInstanceFromConfig("32k").CreateStreamChatRequest(&chatgpt.ChatProps{
 				Model:   props.Model,
 				Message: props.Message,
 				Token: utils.Multi(
 					props.Token == 0,
 					utils.Multi(globals.IsGPT4Model(props.Model) || props.Plan || props.Infinity, -1, 2500),
 					props.Token,
 				),
 			}, hook)
 		}
 	}
 	if IsAvailableError(err) && retry < MaxRetries {
 		fmt.Println(fmt.Sprintf("retrying chatgpt pool (times: %d, error: %s)", retry+1, err.Error()))
 		return retryChatGPTPool(props, hook, retry+1)
--- a/addition/generation/api.go
+++ b/addition/generation/api.go
@ -86,6 +86,7 @@ func GenerateAPI(c *gin.Context) {
 	}
 	if err != nil {
 		auth.RevertSubscriptionUsage(cache, user, form.Model, plan)
 		conn.Send(globals.GenerationSegmentResponse{
 			End:   true,
 			Error: err.Error(),
--- a/app/src/components/home/ModelSelector.tsx
+++ b/app/src/components/home/ModelSelector.tsx
@ -38,14 +38,14 @@ function ModelSelector(props: ModelSelectorProps) {
  });
  const list = supportModels.map((model: Model): SelectItemProps => {
-    const array = ["gpt-4-0613", "gpt-4v", "gpt-4-dalle", "claude-2"];
+    const array = ["gpt-4-0613", "gpt-4v", "gpt-4-dalle", "claude-2-100k"];
    if (subscription && array.includes(model.id)) {
      return {
        name: model.id,
        value: model.name,
        badge: { variant: "gold", name: "plus" },
      } as SelectItemProps;
-    } else if (student && model.id === "claude-2") {
+    } else if (student && model.id === "claude-2-100k") {
      return {
        name: model.id,
        value: model.name,
--- a/app/src/conf.ts
+++ b/app/src/conf.ts
@ -8,7 +8,7 @@ import {
 } from "@/utils/env.ts";
 import { getMemory } from "@/utils/memory.ts";
-export const version = "3.6.9";
+export const version = "3.6.9rc";
 export const dev: boolean = getDev();
 export const deploy: boolean = true;
 export let rest_api: string = getRestApi(deploy);
@ -24,15 +24,15 @@ export const supportModels: Model[] = [
  { id: "gpt-4v", name: "GPT-4V", free: false, auth: true },
  { id: "gpt-4-dalle", name: "DALLE3", free: false, auth: true },
  // anthropic models
  { id: "claude-2", name: "Claude-2", free: true, auth: false },
  { id: "claude-2-100k", name: "Claude-2-100k", free: false, auth: true },
  // spark desk
  { id: "spark-desk-v3", name: "讯飞星火 V3", free: true, auth: true },
  { id: "spark-desk-v2", name: "讯飞星火 V2", free: true, auth: true },
  { id: "spark-desk-v2", name: "讯飞星火 V1.5", free: true, auth: true },
  // anthropic models
  { id: "claude-1", name: "Claude-2", free: true, auth: false },
  { id: "claude-2", name: "Claude-2-100k", free: false, auth: true }, // not claude-2-100k
  // dashscope models
  { id: "qwen-plus-net", name: "通义千问 Plus X", free: false, auth: true },
  { id: "qwen-plus", name: "通义千问 Plus", free: false, auth: true },
--- a/app/src/conversation/addition.ts
+++ b/app/src/conversation/addition.ts
@ -18,7 +18,6 @@ type SubscriptionResponse = {
  enterprise?: boolean;
  usage: {
    gpt4: number;
    dalle: number;
  };
 };
@ -67,7 +66,7 @@ export async function getSubscription(): Promise<SubscriptionResponse> {
        status: false,
        is_subscribed: false,
        expired: 0,
-        usage: { gpt4: 0, dalle: 0 },
+        usage: { gpt4: 0 },
      };
    }
    return resp.data as SubscriptionResponse;
@ -77,7 +76,7 @@ export async function getSubscription(): Promise<SubscriptionResponse> {
      status: false,
      is_subscribed: false,
      expired: 0,
-      usage: { gpt4: 0, dalle: 0 },
+      usage: { gpt4: 0 },
    };
  }
 }
--- a/app/src/dialogs/Subscription.tsx
+++ b/app/src/dialogs/Subscription.tsx
@ -31,7 +31,6 @@ import {
  FolderGit2,
  Globe,
  Image,
  ImagePlus,
  LifeBuoy,
  MessageSquare,
  MessagesSquare,
@ -200,14 +199,6 @@ function Subscription() {
                          <p>{usage?.gpt4}</p> / <p> 50 </p>
                        </div>
                      </div>
                      <div className={`sub-column`}>
                        <ImagePlus className={`h-4 w-4 mr-1`} />
                        DALL-E
                        <div className={`grow`} />
                        <div className={`sub-value`}>
                          <p>{usage?.dalle}</p> / <p> 2000 </p>
                        </div>
                      </div>
                    </>
                  )}
                </div>
--- a/app/src/store/subscription.ts
+++ b/app/src/store/subscription.ts
@ -11,7 +11,6 @@ export const subscriptionSlice = createSlice({
    expired: 0,
    usage: {
      gpt4: 0,
      dalle: 0,
    },
  },
  reducers: {
--- a/auth/rule.go
+++ b/auth/rule.go
@ -50,8 +50,15 @@ func HandleSubscriptionUsage(db *sql.DB, cache *redis.Client, user *User, model
 	return false
 }
-// CanEnableModelWithSubscription returns (canEnable, usePlan)
+func RevertSubscriptionUsage(cache *redis.Client, user *User, model string, plan bool) {
-func CanEnableModelWithSubscription(db *sql.DB, cache *redis.Client, user *User, model string) (bool, bool) {
+	if globals.IsGPT4NativeModel(model) && plan {
 		DecreaseSubscriptionUsage(cache, user, globals.GPT4)
 	} else if model == globals.Claude2100k && !plan {
 		DecreaseSubscriptionUsage(cache, user, globals.Claude2100k)
 	}
 }
 func CanEnableModelWithSubscription(db *sql.DB, cache *redis.Client, user *User, model string) (canEnable bool, usePlan bool) {
 	// use subscription quota first
 	if user != nil && HandleSubscriptionUsage(db, cache, user, model) {
 		return true, true
--- a/auth/subscription.go
+++ b/auth/subscription.go
@ -34,3 +34,7 @@ func BuySubscription(db *sql.DB, user *User, month int) bool {
 func IncreaseSubscriptionUsage(cache *redis.Client, user *User, t string, limit int64) bool {
 	return utils.IncrWithLimit(cache, globals.GetSubscriptionLimitFormat(t, user.ID), 1, limit, 60*60*24) // 1 day
 }
 func DecreaseSubscriptionUsage(cache *redis.Client, user *User, t string) bool {
 	return utils.DecrInt(cache, globals.GetSubscriptionLimitFormat(t, user.ID), 1)
 }
--- a/auth/user.go
+++ b/auth/user.go
@ -4,7 +4,6 @@ import (
 	"chat/globals"
 	"chat/utils"
 	"database/sql"
 	"errors"
 	"fmt"
 	"github.com/dgrijalva/jwt-go"
 	"github.com/gin-gonic/gin"
@ -219,11 +218,8 @@ func (u *User) CreateApiKey(db *sql.DB) string {
 func (u *User) GetApiKey(db *sql.DB) string {
 	var key string
 	if err := db.QueryRow("SELECT api_key FROM apikey WHERE user_id = ?", u.GetID(db)).Scan(&key); err != nil {
 		if errors.Is(err, sql.ErrNoRows) {
 		return u.CreateApiKey(db)
 	}
 		return ""
 	}
 	return key
 }
--- a/globals/variables.go
+++ b/globals/variables.go
@ -54,8 +54,8 @@ const (
 	GPT432k0613       = "gpt-4-32k-0613"
 	Dalle2            = "dalle"
 	Dalle3            = "gpt-4-dalle"
-	Claude2           = "claude-1" // claude v1.3
+	Claude2           = "claude-2"
-	Claude2100k       = "claude-2"
+	Claude2100k       = "claude-2-100k"
 	ClaudeSlack       = "claude-slack"
 	SparkDesk         = "spark-desk-v1.5"
 	SparkDeskV2       = "spark-desk-v2"
--- a/manager/chat.go
+++ b/manager/chat.go
@ -106,6 +106,7 @@ func ChatHandler(conn *Connection, user *auth.User, instance *conversation.Conve
 	if err != nil && err.Error() != "signal" {
 		globals.Warn(fmt.Sprintf("caught error from chat handler: %s (instance: %s, client: %s)", err, model, conn.GetCtx().ClientIP()))
 		auth.RevertSubscriptionUsage(cache, user, model, plan)
 		CollectQuota(conn.GetCtx(), user, buffer, plan)
 		conn.Send(globals.ChatSegmentResponse{
 			Message: err.Error(),
--- a/manager/completions.go
+++ b/manager/completions.go
@ -46,6 +46,7 @@ func NativeChatHandler(c *gin.Context, user *auth.User, model string, message []
 		buffer.Write(resp)
 		return nil
 	}); err != nil {
 		auth.RevertSubscriptionUsage(cache, user, model, plan)
 		CollectQuota(c, user, buffer, plan)
 		return keyword, err.Error(), GetErrorQuota(model)
 	}
--- a/middleware/throttle.go
+++ b/middleware/throttle.go
@ -28,9 +28,7 @@ func (l *Limiter) RateLimit(ctx *gin.Context, rds *redis.Client, ip string, path
 var limits = map[string]Limiter{
 	"/login":        {Duration: 10, Count: 5},
-	"/anonymous":    {Duration: 60, Count: 15},
+	"/apikey":       {Duration: 1, Count: 2},
 	"/card":         {Duration: 1, Count: 5},
 	"/user":         {Duration: 1, Count: 1},
 	"/package":      {Duration: 1, Count: 2},
 	"/quota":        {Duration: 1, Count: 2},
 	"/buy":          {Duration: 1, Count: 2},
@ -41,6 +39,7 @@ var limits = map[string]Limiter{
 	"/invite":       {Duration: 7200, Count: 20},
 	"/v1":           {Duration: 1, Count: 600},
 	"/card":       {Duration: 1, Count: 5},
 	"/generation": {Duration: 1, Count: 5},
 	"/article":    {Duration: 1, Count: 5},
 }
--- a/utils/tokenizer.go
+++ b/utils/tokenizer.go
@ -88,7 +88,7 @@ func CountInputToken(model string, v []globals.Message) float32 {
 	case globals.Claude2:
 		return 0
 	case globals.Claude2100k:
-		return float32(CountTokenPrice(v, model)) / 1000 * 0.008
+		return float32(CountTokenPrice(v, model)) / 1000 * 0.05
 	case globals.ZhiPuChatGLMPro:
 		return float32(CountTokenPrice(v, model)) / 1000 * 0.1
 	case globals.ZhiPuChatGLMStd:
@ -118,7 +118,7 @@ func CountOutputToken(model string, t int) float32 {
 	case globals.Claude2:
 		return 0
 	case globals.Claude2100k:
-		return float32(t*GetWeightByModel(model)) / 1000 * 0.008
+		return float32(t*GetWeightByModel(model)) / 1000 * 0.05
 	case globals.ZhiPuChatGLMPro:
 		return float32(t*GetWeightByModel(model)) / 1000 * 0.1
 	case globals.ZhiPuChatGLMStd: