import streamlit as st import pandas as pd import plotly.express as px import numpy as np # Umrechnungsfaktor von Terabytes nach Bytes TB2B = 1024**4 # Seitenkonfiguration (gibt uns ein schönes breites Layout) st.set_page_config(layout="wide") # 1. Daten laden (Pfad aus deinem Docker-Setup) FILE_PATH = "/data/json_cache.json" PRICE_PER_TB = 8.1 # CHF / TB @st.cache_data def load_data(): # Falls die Datei existiert, laden, sonst leeres Dataframe für den Test try: return pd.read_json(FILE_PATH) except Exception: # Dummy-Daten, falls Node-RED noch nichts abgelegt hat return pd.DataFrame([ {"ownerGroup": "a-123", "department": "4000", "size": 500000}, {"ownerGroup": "p9999", "department": "6000", "size": 1200000} ]) df = load_data() # Initialisierung des Session State für die Bereichs-Analyse if "department" in df.columns: depts = sorted(df["department"].unique().tolist()) if 'gewaehltes_dept' not in st.session_state: st.session_state.gewaehltes_dept = depts[0] if depts else None # 2. NAVIGATION LINKS (Sidebar) st.sidebar.title("Navigation") st.sidebar.markdown("Wählen Sie eine Ansicht:") # Ein Radio-Button verhält sich wie eine klickbare Liste auswahl = st.sidebar.radio( label="Ansichten", options=[ "Übersicht & Metriken", "Bereichs-Analyse", "Nicht zuweisbare Daten", "Rohdaten" ], label_visibility="collapsed" # Versteckt das Label für eine sauberere Optik ) # 3. ANZEIGE RECHTS (Hauptbildschirm) # Hier steuern wir den Inhalt basierend auf der Auswahl links if auswahl == "Übersicht & Metriken": st.title("Übersicht") # Beispiel für schnelle Metriken rechts total_vol = df["size"].sum() total_packed_vol = df["packedSize"].sum() col1, col2 = st.columns(2) col1.metric("Gesamtvolumen (TB)", f'{total_vol/TB2B:.2f}') col1.metric("Gesamtes packetiertes Volumen (TB)", f'{total_packed_vol/TB2B:.2f}') col1.metric("Anzahl Archivgruppen", len(df)) df_department_overview = df.groupby('department')['packedSize'].sum().to_frame() df_department_overview["Anteil [%]"] = ( 100 * df_department_overview["packedSize"] / total_packed_vol ) df_department_overview['Kosten [CHF]'] = ( (df_department_overview['packedSize'] / TB2B) * PRICE_PER_TB ) df_department_overview['packedSize'] = df_department_overview['packedSize']/TB2B # Spalten/Indexnamen nur für die Anzeige anpassen df_department_overview.index.name = "Bereich" df_department_overview.rename( columns={"packedSize": "Totales packetiertes Volumen [TB]"}, inplace=True ) # st.table ist besser für kleine, statische Tabellen, die den Inhalt voll anzeigen sollen col2.table( df_department_overview.style.format({ "Totales packetiertes Volumen [TB]": "{:.4f}", "Anteil [%]": "{:.2f}", "Kosten [CHF]": "{:.2f}" }) ) # col2.metric("Abteilungen", f'{df.groupby('department')['packedSize'].sum().to_frame()}', use_container_width=True) # Hier könnte eine Grafik hin if "department" in df: fig = px.pie( df, names="department", values="packedSize", title="Verteilung nach Bereichen" ) # Legende explizit positionieren, um den Abstand zu verringern fig.update_layout(legend=dict(x=0.7, y=0.5)) st.plotly_chart(fig) elif auswahl == "Bereichs-Analyse": st.title("Bereichs-Analyse") # Ein zusätzlicher Filter, der nur in dieser Ansicht erscheint if "department" in df and depts: # Finde den Index des gespeicherten Departments try: default_index = depts.index(st.session_state.gewaehltes_dept) except ValueError: default_index = 0 # Erstelle die Selectbox und speichere die neue Auswahl neue_auswahl = st.selectbox( "Bereich auswählen:", depts, index=default_index ) st.session_state.gewaehltes_dept = neue_auswahl filtered_df = df[df["department"] == st.session_state.gewaehltes_dept].copy() # Werte in der Spalte 'copies' durch Zahlen ersetzen if "copies" in filtered_df.columns: conditions = [ filtered_df['copies'].str.startswith('one', na=False), filtered_df['copies'].str.startswith('two', na=False) ] choices = [1, 2] filtered_df['copies'] = np.select(conditions, choices, default=filtered_df['copies']) # DataFrame nach 'packedSize' absteigend sortieren if "packedSize" in filtered_df.columns: filtered_df = filtered_df.sort_values(by="packedSize", ascending=False) # Spaltennamen für die Anzeige anpassen rename_mapping = { "ownerGroup": "Gruppe", "copies": "Anzahl Kopien", "size": "unpacketierte Grösse", "packedSize": "packetierte Grösse", "beamline": "Beamline", "department": "Bereich" } filtered_df.rename(columns=rename_mapping, inplace=True) # Neue Spalte 'Kosten' hinzufügen if "packetierte Grösse" in filtered_df.columns: filtered_df["Kosten [CHF]"] = (filtered_df["packetierte Grösse"] / TB2B) * PRICE_PER_TB st.metric(f"Anzahl Gruppen in Department {st.session_state.gewaehltes_dept}", len(filtered_df)) st.dataframe(filtered_df, use_container_width=True, hide_index=True) elif auswahl == "Nicht zuweisbare Daten": st.title("Nicht zuweisbare Daten") # Filtere Zeilen, bei denen 'department' nicht in eine Zahl umgewandelt werden kann no_department_df = df[pd.to_numeric(df['department'], errors='coerce').isna()].copy() no_department_vol = no_department_df['packedSize'].sum() st.write(f'Gesamtvolumen der nicht zuweisbaren Daten: {no_department_vol/TB2B:.2f} TB') st.write(f'Anzahl der nicht zuweisbaren Gruppen: {len(no_department_df)}') no_department_df = no_department_df.sort_values(by="packedSize", ascending=False) no_department_df['unpacketierte Grösse [GB]'] = no_department_df['size'] / (TB2B/1024) no_department_df['packetierte Grösse [GB]'] = no_department_df['packedSize'] / (TB2B/1024) no_department_df["Kosten [CHF]"] = (no_department_df["packedSize"] / TB2B) * PRICE_PER_TB del(no_department_df['size']) del(no_department_df['packedSize']) del(no_department_df['beamline']) # Werte in der Spalte 'copies' durch Zahlen ersetzen if "copies" in no_department_df.columns: conditions = [ no_department_df['copies'].str.startswith('one', na=False), no_department_df['copies'].str.startswith('two', na=False) ] choices = [1, 2] no_department_df['copies'] = np.select(conditions, choices, default=no_department_df['copies']) # Spaltennamen für die Anzeige anpassen rename_mapping = { "ownerGroup": "Gruppe", "copies": "Anzahl Kopien", "department": "Bereich" } no_department_df.rename(columns=rename_mapping, inplace=True) # Index zurücksetzen, damit er nicht als Spalte angezeigt wird st.table(no_department_df.reset_index(drop=True)) elif auswahl == "Rohdaten": st.title("Rohdaten") st.write("Durchsuchen und filtern Sie die vollständige Liste der Gruppen. Grössenangaben in Bytes.") # Die Tabelle ohne Index und mit voller Höhe anzeigen st.dataframe(df, use_container_width=True) #, hide_index=True)