Research, Society and Development, 3(10), p. e7210313118, 2021
Objetivo: Utilizar as técnicas de análise multivariada, em particular a análise de componentes principais, para encontrar a melhor descrição dos índices de seca, e em seguida usar a análise de agrupamentos para determinar as regiões homogêneas do Rio São Francisco. Método: Foram calculados os índices para caracterizar a seca: Média anual de precipitação máxima diária (anualmax), média anual de precipitação acumulada (amount), média anual de dias sem chuva (<1 mm) (noprec), média anual de dias consecutivos sem chuva (<1 mm) (consecdry), média anual de dias consecutivos com chuva (>=1 mm) (consecwet) e a média anual de dias chuvosos com Precipitação excedendo o percentil 90% (prec90). Esses índices foram ortogonalizados por meio do método de componentes principais e posteriormente agrupados por meio do método de K-médias. Resultados: As variáveis amount e prec90 são as mais importantes, e juntas no primeiro componente são responsáveis por 40,56%, e as variáveis noprec e consecwet foram importantes para explicar 31,04% na segunda componente, e juntas explicam 71,60% da variabilidade total dos dados. Através da variabilidade de 86,40% nas três primeiras componentes principais retidas, a técnica de agrupamentos K-médias possibilitou a divisão de quatro áreas homogêneas na bacia do São Francisco. Conclusões: Foram observadas 4 regiões que são compostas pelas regiões do baixo e Sub-Médio São Francisco, Alto São Francisco e o Médio São Francisco, dividindo-se em duas partes que não ocorre uma perfeita correspondência com as otto-regiões estabelecidas.