Spaces:

pradeei
/

genai_projects

Sleeping

App Files Files Community

pradeei commited on Feb 18

Commit

f9a9244

verified ·

1 Parent(s): 37fa3f6

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -54

app.py CHANGED Viewed

@@ -1,73 +1,40 @@
-# Import necessary libraries
 import streamlit as st
-import os
 from openai import OpenAI
-import json
-import utils
-DENVR_API_KEY = utils.DENVR_API_KEY
-working_dir = os.path.dirname(os.path.abspath(__file__))
-endpoint_data = json.load(open(f"{working_dir}/model_info.json"))
-xeon_endpoint_data = json.load(open(f"{working_dir}/model_info_xeon.json"))
 def clear_chat():
     st.session_state.messages = []
 st.title("Inference as a Service Playground")
-# Extract the keys (model names) from the JSON data
-model_names = list(endpoint_data.keys())
-xeon_model_names = list(xeon_endpoint_data.keys())
 endpoint = ""
 hardware_option = ""
 with st.sidebar:
-    # Add radio buttons for "Gaudi" and "Xeon"
-    option = st.radio("Select Hardware", ("Gaudi (Denvr)", "Xeon (AWS)"))
-    hardware_option = option
-    # Display corresponding model dropdowns based on the selected hardware
-    if option == "Gaudi (Denvr)":
-        modelname = st.selectbox("Select a LLM model (Hosted by DENVR DATAWORKS) runs on Gaudi", model_names)
-        endpoint = endpoint_data[modelname]
-        CLIENT_SECRET = os.getenv('CLIENT_SECRET')
-        if DENVR_API_KEY == "" or utils.is_token_expired(DENVR_API_KEY, CLIENT_SECRET):
-            DENVR_API_KEY = utils.generate_token(hardware_option)
-        print(f"Gaudi Endpoint: {endpoint}")
-    elif option == "Xeon (AWS)":
-        modelname = st.selectbox("Select a LLM model that runs on Xeon", xeon_model_names)
-        endpoint = xeon_endpoint_data[modelname]
-        CLIENT_SECRET = os.getenv('XEON_CLIENT_SECRET')
-        if DENVR_API_KEY == "" or utils.is_token_expired(DENVR_API_KEY, CLIENT_SECRET):
-            DENVR_API_KEY = utils.generate_token(hardware_option)
-        print(f"Xeon Endpoint: {endpoint}")
-    # modelname = st.selectbox("Select a LLM model (Hosted by DENVR DATAWORKS) ", model_names)
-    st.write(f"You selected: {modelname}")
     st.button("Start New Chat", on_click=clear_chat)
-api_key = DENVR_API_KEY
-base_url = endpoint
 client = OpenAI(api_key=api_key, base_url=base_url)
-# Extract the model name
-models = client.models.list()
-modelname = models.data[0].id
 if "messages" not in st.session_state:
     st.session_state.messages = []
 for message in st.session_state.messages:
     with st.chat_message(message["role"]):
         st.markdown(message["content"])
 if prompt := st.chat_input("What is up?"):
     st.session_state.messages.append({"role": "user", "content": prompt})
     with st.chat_message("user"):
         st.markdown(prompt)
     with st.chat_message("assistant"):
         stream = client.chat.completions.create(
             model=modelname,
@@ -79,6 +46,4 @@ if prompt := st.chat_input("What is up?"):
             stream=True,
         )
         response = st.write_stream(stream)
-    st.session_state.messages.append({"role": "assistant", "content": response})

 import streamlit as st
 from openai import OpenAI
 def clear_chat():
     st.session_state.messages = []
 st.title("Inference as a Service Playground")
 endpoint = ""
 hardware_option = ""
+api_key = ""
+base_url = ""
+modelname = ""
 with st.sidebar:
     st.button("Start New Chat", on_click=clear_chat)
+    # Input fields for API key and base URL
+    api_key = st.text_input("API Key", type="password")
+    base_url = st.text_input("Base URL")
+    model_name = st.text_input("Model Id")
 client = OpenAI(api_key=api_key, base_url=base_url)
 if "messages" not in st.session_state:
     st.session_state.messages = []
 for message in st.session_state.messages:
     with st.chat_message(message["role"]):
         st.markdown(message["content"])
 if prompt := st.chat_input("What is up?"):
     st.session_state.messages.append({"role": "user", "content": prompt})
     with st.chat_message("user"):
         st.markdown(prompt)
     with st.chat_message("assistant"):
         stream = client.chat.completions.create(
             model=modelname,
             stream=True,
         )
         response = st.write_stream(stream)
+    st.session_state.messages.append({"role": "assistant", "content": response})