Articoli correlati

Gage thumbnail
immagine
immagine

Introduzione al prodotto riparabile

Nel contesto dell’analisi dei dati di affidabilità, i dati raccolti relativi a uno specifico prodotto o modalità di guasto vengono generalmente assunti come statisticamente indipendenti e distribuiti secondo la stessa legge probabilistica; tale ipotesi è nota come Independent and Identically Distributed (IID). Una sequenza di guasti (variabile aleatoria) è considerata IID quando:

  • ogni guasto segue la medesima distribuzione statistica;
  • tutti gli eventi sono mutuamente indipendenti, ossia il verificarsi di un guasto non influenza direttamente la probabilità di un altro.

Nelle tradizionali analisi di affidabilità, i prodotti osservati vengono assunti come nuovi al tempo zero e la sostituzione di un’unità guasta avviene con un’unità identica e nuova (as-good-as-new). In questo caso ci si riferisce a prodotti non riparabili, o “usa e getta”. L’interpretazione di questi dati avviene attraverso modelli statistici quali Esponenziale, Weibull, Lognormale, Logistico…

La situazione è differente nel caso dei prodotti riparabili. Per un prodotto riparabile, ad esempio un’automobile, dopo un certo kilometreaggio, si riscontrerà una configurazione eterogenea: alcuni componenti saranno quelli originali, altri, quali le pastiglie dei freni, saranno stati sostituiti preventivamente con componenti nuove o nel corso di interventi di manutenzione.

Altri interventi, presenteranno caratteristiche diverse nel senso che la riparazione potrebbe essere avvenuta senza la sostituzione della componente guasta con una identica ma nuova. Per esempio, la riparazione di un pneumatico forato. In alcuni casi, tale intervento, comporta la riparazione della foratura senza la sostituzione del pneumatico stesso. In questo caso, il componente, (lo pneumatico), riacquisisce la sua funzionalità senza alcun miglioramento della sua affidabilità. Tale pneumatico rimane quindi as-bad-as-old.

immagine

L’auto considerata sopra, è un prodotto riparabile con una configurazione che include elementi con età differenti, e i guasti che si manifestano nel tempo costituiscono un processo stocastico caratterizzato da eventi interdipendenti e non più identicamente distribuiti.

Tra i due casi estremi (as-good-as-new e as-bad-as-old) esiste una configurazione intermedia associata al ripristino parziale, come l’impiego di componenti ricondizionate che migliorano la condizione del prodotto senza riportarlo allo stato di nuovo. Tale caso conosciuto come ripristino parziale non è argomento di questo articolo ma è pienamente supportato dal programma Weibull++ nell’interfaccia RDA parametrica.

icona weibull++

Questo articolo si concentra su sistemi complessi per i quali si può ragionevolmente assumere che l’intervento di riparazione o sostituzione non modifichi in modo significativo l’affidabilità complessiva del sistema lasciandolo, dopo la riparazione, nello stato as-bad-as-old. Esempi tipici potrebbero essere locomotori, elicotteri, navi, centrali energetiche, sezioni di impianti petrolchimici…

Nei prodotti riparabili è possibile riscontrare correlazioni tra i guasti registrati: gli eventi iniziali influenzano l’evoluzione dei guasti successivi. Questa dipendenza viola l’assunzione IID e rende inappropriato l’uso diretto di modelli quali il modello Weibull più idoneo invece all’analisi di vita di campionature omogenee di prodotti non riparabili o usa e getta.icona RGA

Sia l’analisi della crescita dell’affidabilità (reliability growth) sia i modelli dedicati ai sistemi riparabili forniscono invece strumenti adeguati per descrivere processi stocastici con eventi dipendenti.

Il modello Crow-AMSAA (programma RGA)

Il modello Crow–AMSAA (o Non Homogeneous Poisson Process, NHPP) rappresenta un approccio statistico in grado di trattare correttamente:

  • l’analisi dei dati di crescita dell’affidabilità di sistemi complessi; approccio consolidato in ambito difesa.
  • L’analisi di prodotti riparabili in alternativa al metodo RBD, potenzialmente oneroso per la quantità di dati richiesti, e al metodo di predizione fortemente limitato dal vincolo di tasso di guasto costante nel tempo.

Questi due contesti, condividono un elemento essenziale: la configurazione del sistema non è statica, ma evolve nel tempo in funzione delle modifiche introdotte in fase di sviluppo o di riparazione durante la sua vita.

Crow-AMSAA approximation

Il modello Crow-AMSAA può esssere interpretato come un’approssimazione continua ad una sequenza di tassi di guasto che il prodotto evidenzia a seguito di interventi migliorativi (test di crescita) o di riparazione (prodotto riparabile). Esso, si differenzia dall’approccio predittivo tradizionale, che si basa sulla somma dei tassi di guasto delle singole componenti ricavati da librerie, privilegiando invece un’analisi statistica basata su dati reali.

L’approccio NHPP consente di stimare accuratamente il numero previsto di guasti nel tempo oltre al valore di MTBF e/o intensità di guasto raggiunti ad una determinata frazione temporale. L’elemento chiave è il riconoscimento che, pur essendo casuali, i guasti possono manifestarsi con un tasso variabile nel tempo. Questo aspetto apre la strada all’implementazione di strategie di manutenzione preventiva, non possibili mediante modelli predittivi classici quali MIL-HDBK-217F (basato su modello esponenziale) o Telcordia SR-332 e OREDA (basati sul modello gamma).

Cosa succede nel reale

Nella realtà i tassi di guasto cambiano come in una funzione a gradino, non cambiano gradualmente:

  • un problema viene portato alla luce e risolto → il tasso di guasto si abbassa.
  • Una soluzione introduce un nuovo problema → il tasso di guasto aumenta.
  • Il test mette in evidenza usura → il tasso di guasto aumenta uleriormente.

Di conseguenza il vero tasso di guasto assume più la forma di una funzione a gradino nel tempo.

Cosa ipotizza il modello Crow–AMSAA

Il modello Crow–AMSAA sostituisce questo comportamento discreto con una curva dolce continua che rappresenta la funzione di intensità di guasto λ(t)=λβtβ-1

Questa funzione:

  • cambia continuamente nel tempo.
  • Rappresenta l’effetto medio di tanti piccoli miglioramenti o degradazioni.
  • Evita di modellare esplicitamente ogni modifica apportata.

Matematicamente rappresenta una continua approssimaizone a tanti cambiamenti discreti.

La dimostrazione di questo la si ha considerando gli intervalli infinitesimali. Se dividiamo il tempo in intervalli molto piccoli (t0,t1), (t1,t2)… in ogni piccolo intervallo il tasso di guasto è approssimativamente costante, tale che ρ(t)≈ρ(ti​)

Il modello Crow-AMSAA si comporta come un aggregato di segmenti di tasso di guasto costante approssimati tra loro da una curva continua.

Questa approssimazione è molto utile in quanto

  • riduce la complessità del modello.
  • Funziona bene con dati sparsi.
  • Permette di sviluppare facilmente previsioni.
  • Offre un singolo parametro di crescita di facile interpretazione (β)
Failure Intensity di un sistema complesso con intervalli discreti.

Failure Intensity di un sistema complesso con intervalli discreti. Beta minore di 1 implica crescita

Anche se miglioramenti/interventi avvengono in forma discreta, l’effetto aggregato spesso appare nascosto su scala log-log.

Il modello Crow–AMSAA non dice che il tasso di guasto cambia continuamente ma che

Il processo di osservazione dei guasti può essere rappresentato statisticamente come se il tasso cambiasse continuamente.

Questa distinzione è cruciale.

Crow–AMSAA modella il cumulativo del numero dei guasti nel tempo su scala log-log usando un Non-Homogeneous Poisson Process.
Ciò significa che:

  • i guasti avvengano randomicamente,
  • ma il tasso di occorrenza può variare nel tempo.
Crow-AMSAA Cumulative Number of Failiure on a Log-Log Scale

Crow-AMSAA cumulativo dei guasti su scala log-log

Ciò rende il modello utile per monitorare miglioramenti o peggioramenti (degradazioni/usure) che si riflettono negli indici di valutazione del sistema (MTBF in primis).

Il modello ipotizza che che il cumulativo dei guasti N(t) segua una legge di potenza N(t)=λtβ

dove λ è il parametro di scala della funzione mentre β è il parametro di forma e rappresenta il tasso di crescita del modello o pendenza della retta. Da quì si può intuire che in base al valore di beta si distingueranno comportamenti diversi (vedasi grafico sotto). Non solo, ma grazie alla trasformazione logaritmica del modello lnN(t)=lnλ+β lnt il modello Crow-AMSAA risulta linearizzato e di facile interpretazione oltre al fatto che l’interpolazione dei punti al modello facilita una valutazione critica del modello stesso.

Dato N(t) come il numero cumulativo di guasti osservati nel tempo t e sia invece  \rho(t) l’intensità di guasto del modello Crow-AMSAA. Per piccoli intervalli (t+\Delta t), l’intensità di guasto in tale intervallo \rho(t) si può approssimare alla probabilità di guasto nell’intervallo (t, t+\Delta t) con la condizione che il \Delta t sia piccolo. Questo aspetto è molto importante in quanto c’è da chiedersi che cosa succede alle probabilità in un piccolo intervallo.

Per un modello NHPP, l’intensità di guastdo o failure intensity è definita come

\rho(t)=\lim_{\Delta t \to 0} \frac{P\{\text{un guasto avvien tra }(t, t+\Delta t)\}}{\Delta t}

da cui riarrangiando, si ottiene P{guasto (t,t+\Delta t)}≈\rho(t)\Delta t per piccoli \Delta t.

La probabilità che si verifichi un guasto in un piccolo intervallo \Delta t dipende dalla lunghezza dell’intervallo stesso. Se l’intervallo è piccolo, la probabilità che si verifichino più di un guasto è pressochè nulla. Con un piccolo intervallo, il sistema non ha il tempo necessario per cambiare in maniera apprezzabile all’interno dell’intervallo stesso. Per questa ragione, si può ritenere costante.

Applicando la derivata al cumulativo dei guasti, si ottiene l’intensità di guasto o il tasso di guasto istantaneo: λ(t)=λβtβ-1 utile per vedere come l’intensità di guasto varia nel tempo.

Significato del parametro beta

Il modello NHPP power law è anche conosciuto come Weibull Process poichè si fonda sull’ipotesi che il primo guasto al sistema segua una funzione Weibull mentre i guasti successivi sono governati dal modello Poisson.

Il tasso di guasto e l’intensità di guasto sono concetti molto simili. Il termine intensità di guasto si riferisce tipicamente ad un processo come un programma di crescita dell’affidabilità. Mentre un tasso di guasto è più comunemente associato ad un componente. Se consideriamo un sistema quando esso entra in servizio, la sua età iniziale è zero ore. Cioè il sistema è nuovo e formato da componenti nuove.

Nel contesto di un processo Poisson non omogeneo adatto a modellare la variazione del tasso di guasto, il primo guasto è regolato da una distribuzione f(t) con tasso di guasto \lambda(t). Ogni guasto successivo è regolato dalla funzione di intensità diversa, es. \rho (t) del processo. Questo perchè ad ogni riparazione, la configurazione del sistema cambia: risulta ora formato da componenti originali e componenti sostituite a seguito di interventi. L’intensità di guasto \rho(t) per il processo NHPP ha la stessa forma funzionale del tasso di guasto che governa il primo guasto del sistema \lambda(t).

Pertanto, se il primo guasto al sistema segue una distribuzione Weibull, il tasso di guasto è dato da

\rho(t) = \frac{f(t)}{R(t)} dove

f(t; \beta, \eta) =\frac{\beta}{\eta} \left( \frac{t}{\eta} \right)^{\beta-1} e^{-(t/\eta)^\beta} mentre  R(t) = e^{-(t/\eta)^\beta}

Il risultato del rapporto risulta in \rho(t) = \frac{\beta}{\eta}\frac{t^{\beta - 1}}{\eta^{\beta - 1}}

che semplifica a \rho(t) =\frac {\beta{t^{\beta - 1}}}{\eta^{\beta}}

Infine, ponendo \lambda =\frac{1}{\eta^{\beta}}, \rho(t) diventa: \rho(t) =\lambda \beta t^{\beta - 1}

Crow-AMSAA plot with different beta

Grafico del cumulativo dei guasti in funzione del cumulativo del tempo per diverse funzioni di crescita

Significato del parametro Beta nel modello Crow-AMSAA

β

Interpretazione

Significato

β<1

Affidabilità miglioraLa linea sale ma meno rapidamente nel tempo. I guasti si verificano meno frequentemente, gli interventi migliorativi o di manutenzione risultano efficaci.

β=1

L’affidabilità rimane costanteLa linea è esattamente lineare nel dominio log-log con pendenza uguale a 1. I guasti seguono un regolare processo Poisson con intensità di guasto costante. Non si registrano miglioramenti ne crescita dell’affidabilità.
Si registra uno stabile aumento del cumulativo dei guasti al cumulativo del tempo

β>1

L’affidabilità peggiora (sistema si degrada)La linea sale con pendenza sempre maggiore. I guasti si verificano sempre più di frequente. Il sistema esibisce usura o i problemi relativamente al prodotto si stanno accumulando.

La maggior parte dei programmi di crescita dell’affidabilità puntano ad un β<1. E’ importante non confondere questi valori di beta con il beta del modello Weibull. Qui non rappresentano mortalità infantile

Regole pratiche:

  • β ≈ 0.6 or minore  = crescita pronunciata dell’affidabilità
  • 0.6 < β < 0.9 = crescita moderata
  • β = 1.0 = nessuna crescita
  • β > 1.0 = profondo rosso

Punti deboli del modello Crow-AMSAA

L’interpretazione del modello Crow–AMSAA come un’approssimazione continua ad una sequenza di tassi di guasto variabili è potente, ma non è universalmente valida. Come qualsiasi modello statistico anche il modello Crow-AMSAA ha le sue vulnerabilità. Di seguito, quando e perché questa approssimazione fallisce, sia dal punto di vista matematico che ingegneristico.

  • Importanti modifiche (modifiche radicali) al progetto – Il programma RGA ha in serbo funzionalità che permettono di modellare “step changes” ma di per sè il modello Crow-AMSAA con una sua unica legge di potenza a cambiamento graduale non può rappresentare grandi salti.
  • Pochi guasti – con meno di 10-15 guasti aumenta l’incertezza del pametro di forma. La pendenza è dominata da randomicità e la crescita potrebbe essere illusoria.
  • Guasti a raffica – il modello Poisson predilige randomicità quindi se i guasti si accavallano in intervalli estremamente ristretti, altri fenomeni sono da investigare. In primis common cause failure o shock ambientale.
  • Comportamento non monotonico – per esempio miglioramento iniziale (debugging, procedure..) seguito da usura nel tempo. Il modello Crow-AMSAA ipotizza un solo comportamento definito dal parametro beta.
  • Guasti dominati da fattori esterni – per esempio i guasti risulano dal profilo di missione, ambiente in cui opera, l’intensità di uso del prodotto… Il modello Crow–AMSAA attribuisce le variazioni nel tasso di guasto al tempo di prova, non alle covariate.
  • Predominanza di mortalità infantile – con mortalità infantile domaninante, il parametro \rho(t) ha valori iniziali molto alti che precipitano rapidamente. Il modello power law non può rappresentare correttamente questo comportamento senza sottostimare la severità dei guasti iniziali o sovrastimare miglioramenti futuri.
Prima della segmentazioneDopo la segmentazione

Identificazione dei cambiamenti nel tempo

Molte grafiche Crow–AMSAA mostrano segmenti ognuno dei quali rappresenta un diverso periodo temporale. Quando questi segmenti cambiano pendenza qualcosa è cambiato nel comportamento del prodotto in esame as seguito di modifiche apportate.

  • Pendenza verso il basso. Il nuovo segmento presenta un valore di β inferiore. Ne consegue che  le modifiche apportare durante il test hanno portato ad  una riduzione dei guasti.
  • Pendenza verso l’alto. Si manifestano nuove modalità di guasto o nuove modalità di guasto introdotte dalle modifiche apportate.
  • Tendenza all’appiattimento: il sistema si sta stabilizzando
  • Discontinuità verticali: modifiche considerevoli apportate al prodotto.

Considerazioni sul grafico

Anche l’esame del grafico nel suo dettaglio è un punto molto importante. Per esempio,

  • punti sotto la linea rappresentano un sistema che sta performando meglio del previsto (numero di guasti inferiore alle aspettative del modello). Al contrario,
  • punti al di sopra della linea rappresentanto un sistema sta performando peggio del previsto (numero di guasti superiore alle aspettative del modello). Nel caso di
  • bruschi salti verso l’alto, questo potrebbe indicare un addensamento di guasti o l’insorgenza di nuove modalità di guasto.

Come leggere un grafico Crow-AMSAA

Controlla la pendenza (β)

β<1 miglioramento; β>1 degradazione/peggiormento

Osserva la posizione verticale di λ

più bassa equivale a meno guasti

Osserva i cambiamenti nei segmenti

La crescita dell’affidabilità si presenta con uno spostamento verso il basso ed una pendenza meno pronunciata

Osserva gli scostamenti tra i punti ed il modello

Punti al di sopra rappresentano un andamento perggiore;
Punti al di sotto rappresentano una condizione migliore.

Esempio di sistema riparabile

Nell’esempio riportato di seguito vengono considerati tre sistemi inizialmente ritenuti compatibili e, pertanto, potenzialmente aggregabili in un unico studio. Tuttavia, un’analisi più approfondita evidenzia come uno dei tre sistemi (in particolare il Sistema 3) presenti un comportamento marcatamente distinto rispetto agli altri. Tale differenza emerge nonostante il Sistema 3 superi il test di compatibilità CVM per il modello Crow-AMSAA. La principale divergenza è attribuibile al livello inferiore del parametro di scala del sistema 3 nonostante il valore mediano sia compatibile.

Il Test dell’Ipotesi del Beta Comune (Common Beta Hypothesis, CBH) è un test statistico impiegato per verificare se i sistemi appartenenti a un insieme di dati condividano valori omogenei del parametro beta. Il test si basa sul confronto delle funzioni di intensità dei singoli sistemi e sulla valutazione dei tassi di interarrivo dei guasti. La statistica di prova viene calcolata a partire dalla media campionaria e confrontata con il valore critico derivato dalla distribuzione chi-quadro. L’obiettivo è testare l’ipotesi nulla secondo cui tutti i sistemi presentano un comportamento statistico equivalente, rifiutandola qualora emergano differenze significative.

Nel caso in esame, il Sistema 3 evidenzia un comportamento statisticamente differente rispetto alle altre due campionature tale da far fallire il test CBH. Tale aspetto è coerente anche con i risultati del test di Laplace, nel quale il Sistema 3 risulta caratterizzato da una fase di deterioramento, a differenza degli altri due sistemi.

Crow-AMSAA Repairable System

Crow-AMSAA Esempio di sistema riparabile formato da tre apparati apparentemente omogenei

Le figure riportate di seguito mostrano le proiezioni del numero cumulativo di guasti, del valore di MTBF, dell’affidabilità e del punto ottimale di manutenzione a livello complessivo. Dalla rappresentazione temporale dei tre sistemi si può osserevare una concentrazione degli guasti nel sistema 3 nella porzione finale dell’orizzonte temporale analizzato.

Esempio sviluppo impianto packaging

Questo secondo esempio prende in considerazione un test di crescita dell’affidabilità applicato ad un impianto di imbottigliamento di fluidi quali shampoo. Il test si protrae per un certo numero di cicli al fine di affinare il comportamento dei sottosistemi incluso l’utilizzo di nuove sensoristiche ed soluzioni ingeneristiche per le quali l’azienda non ha ancora maturato sufficientemente esperienza.

A circa 4000 cicli di lavoro della macchina si opta per alcuni cambiamenti dovuti a formazione di bolle d’aria nel prodotto che rischiano di compromettere la produzione. L’installazione di dispositivi anti-bolla insieme alla regolazione della velocità di riempiemento portano ad un miglioramento della funzionalità della macchina e della produttività della linea stessa. Questo lo si evidenzia nel cambiamento del MTBF sia cumulativo che instantaneo mostrato nell’immagini sotto.

Crow-AMSAA Reliability Growth - Packaging Example

Crow-AMSAA Reliability Growth – Impianto di packaging

Crow-AMSAA Reliability Growth Modification ignored

Crow-AMSAA Reliability Growth Modifiche ignorate

Crow-AMSAA Reliability Growth Modification Accounted

Crow-AMSAA Reliability Growth Modifiche tenute conto

Risorse a disposizione

Il modulo software RGA (Reliability Growth Analysis), add-on opzionale della piattaforma Weibull++, fornisce all’ingegnere RAM un insieme strutturato di strumenti analitici a supporto dello sviluppo di prodotti economicamente sostenibili e caratterizzati da elevati livelli di affidabilità.

Il software Weibull++ integra funzionalità avanzate per la progettazione e pianificazione di esperimenti (DOE) e per l’analisi statistica di prodotti non riparabili, includendo modelli multi-guasto, analisi di degradazione e analisi di garanzia, nonché strumenti dedicati alla pianificazione e alla valutazione delle prove di affidabilità.

icona del blog

Parallelamente, Weibull++ mette a disposizione interfacce specializzate per l’analisi di prodotti riparabili, sia in condizioni di ripristino totale (as-good-as-new) sia di ripristino parziale. L’add-on RGA estende ulteriormente queste capacità introducendo modelli specifici per l’analisi di sistemi riparabili complessi soggetti a riparazione minima (as-bad-as-old), e una vasta gamma di modelli impiegati nei programmi di test di sviluppo e di crescita dell’affidabilità.

Sviluppato dal Dott. Larry Crow (padre della metodologia Crow-AMSAA) in collaborazione con il team ReliaSoft, il modulo RGA include un’ampia gamma di modelli per l’analisi della reliability growth nello sviluppo del prodotto, distinguendosi per completezza e profondità rispetto a strumenti alternativi disponibili sul mercato.

Conclusione

La metodologia Crow–AMSAA, basata su un processo di Poisson non omogeneo (NHPP) a legge di potenza, rappresenta uno strumento efficace e ampiamente consolidato per l’analisi dei dati di affidabilità sia nei test di sviluppo prodotto sia nei sistemi riparabili con riparazione minima (as-bad-as-old). La sua principale forza risiede nella capacità di descrivere l’evoluzione del tasso di guasto nel tempo attraverso un modello matematico semplice ma informativo, in cui il parametro di crescita β fornisce un’indicazione diretta sull’andamento dell’affidabilità.

Nel contesto dei test di sviluppo, il modello Crow–AMSAA consente di monitorare la crescita dell’affidabilità, valutando l’efficacia delle azioni correttive e supportando decisioni ingegneristiche e manageriali. L’analisi grafica su scala log–log permette inoltre di individuare rapidamente deviazioni dal comportamento atteso, come fasi di “infant mortality”, cambiamenti di configurazione o introduzione di nuovi meccanismi di guasto, evidenziando quando l’ipotesi di un trend continuo e monotono non è più valida.

Times to Failure Data
Discrete Data
Multi-Phase Data
Reliability Data
Repairable System Data

Per i prodotti riparabili con riparazione minima, il Crow–AMSAA fornisce un quadro coerente per modellare sistemi in cui ogni intervento ripristina la funzionalità senza migliorare lo stato di affidabilità del prodotto. In questo caso, il modello permette di stimare e confrontare l’intensità di guasto nel tempo, supportando l’analisi di prestazioni operative, la pianificazione della manutenzione e la previsione del carico di guasti futuri, purché la variazione graduale del tasso di guasto sia soddisfatta.

Tuttavia, l’applicazione del modello richiede attenzione critica. La presenza di cambiamenti discreti, forti non-linearità, dati dominati da fenomeni di infant mortality può compromettere la validità dell’approssimazione continua del Crow–AMSAA. In tali casi, l’uso di modelli piecewise, l’esclusione motivata di fasi iniziali o l’integrazione con altri approcci di affidabilità risulta necessario.

In conclusione, il Crow–AMSAA non deve essere interpretato come una rappresentazione esatta dei meccanismi fisici di guasto, ma come un modello statistico di sintesi capace di catturare l’andamento medio dei fenomeni osservati. Se applicato con consapevolezza delle sue ipotesi e dei suoi limiti, esso rimane uno strumento di grande valore per l’analisi, il confronto e la previsione delle prestazioni di affidabilità in sistemi riparabili e in programmi di sviluppo prodotto.

Parts
Gage thumbnail
tach
scheda
immagine