La revue canadienne de statistique Multivariate flattening for better predictions
- 格式:pdf
- 大小:160.22 KB
- 文档页数:13
Des patrons heureux!La situation économique de la France n’est pas bonne. La croissance est faible. Le chômage est élevé. Le pouvoir d’achat diminue. Cependant, les salaires des grands patrons français augmentent chaque année. Avec unerémunération de six millions d’euros par an, les grands patrons français sont les mieux payés d’Europe. Leurs homologues anglais arrivent en deuxième position. Ils sont suivis par les patrons hollandais et allemands.Même quand les entreprises vont mal, les rémunérations des grands patrons français augmentent. En 2002, les pertes des entreprises françaises ont étéconsidérables. La bourse de Paris a reculé de 34%. Cependant, les salaires des patrons du CAC 40 ont progressé de 15% cette année-là.Les salariés les mieux payés en Europe sont les Danois. Les Français arrivent seulement en onzième position. La moitié des salariés français gagnent moins de 1.500 euros nets par mois. 15% des salariés sont payés au SMIC, à peu près 7 euros de l’heure. Le niveau de vie des salariés français diminue. Les prix et les loyers augmentent mais les salaires stagnent. Payer les factures est difficile. Les sorties au restaurant sont un luxe.Les travailleurs français ne sont pas bien payés, mais ils ont quelques avantages par rapport àleurs voisins européens. On dit souvent que les salariés français travaillent moins que leurs confrères européens. Il est vrai qu’avec 35 heures de travail par semaine, 5 semaines de congés payés et 11 jours fériés, les salariés français sont bien lotis. Les malheureux salariés anglais n’ont que 2 semaines de congés payés.Pour deux tiers des Français, la vie familiale est plus importante que le travail. Beaucoup de salariés ont une mauvaise image de leur entreprise. Ils sontmécontents de leur rémunération et de leurs conditions de travail. Un quart des travailleurs sont stressés au boulot. Un tiers des cadres aimeraient changer d’entreprise.。
我在早稻田大学开设了一门通识教育课程—“《论语》精读”。
我和学生们一起细读《论语》原文,主要的阅读参考书包括宋代大儒朱熹的《四书章句集注》和《朱子语类》、明末大儒王夫之的《四书训义》以及民国学者钱穆撰写的《论语新解》。
在这门课上,我会要求学生手抄半部《论语》,希望学生逐字理解《论语》,并增强对《论语》的实体感受。
此外,我要求学生任选《论语》中的一条原文进行详细讲解(包括翻译成英语或日语),并完成一篇读书报告(从夏目漱石的《心》和曹雪芹的《红楼梦》中任选一本)。
这门课受到了学生的认可,选课人数从第一年的20人提升到了第三年的60人,六个学期一共有200多人修过“《论语》精读”课。
J’ai donné un cours d’e nseignement général «Lecture intensive des Analectesde Confucius » à l’Université de Waseda. Je lis les textes originaux des Analectesde Confucius avec mes étudiants, et mes principales références de lecturecomprennent le recueil des Notes sur Les Quatre livres et Les Citations classéesde Zhu Xi, un grand érudit confucéen de la dynastie des Song, Les commentairesinstructifs sur Les Quatre livres de Wang Fuzhi, un autre grand érudit confucéende la fin de la dynastie des Ming, et La nouvelle interprétation des Analectesde Confucius par Qian Mu, érudit de l’ancienne République de Chine. Dansce cours, je demande aux étudiants de copier à la main la moitié des Analectesde Confucius , espérant qu’ils les comprendront mieux mot à mot et qu’ils enauront une meilleure perception physique. En outre, je demande aux étudiantsde choisir l’un des textes originaux des Analectes de Confucius pour l’e xpliqueren détail (y compris la traduction en anglais ou en japonais) et de rédiger uncompte-rendu de lecture (du roman Le cœur de Natsume Soseki ou du Rêvedans le pavillon rouge de Cao Xueqin). Le cours a été si bien accueilli par lesétudiants que le nombre d’étudiants qui l’o nt suivi est passé de 20 la premièreannée à 60 la troisième année, avec plus de 200 personnes ayant suivi le coursdes Analectes de Confucius en six semestres.我在早稻田大学教《论语》Mon cours des Analectes de Confucius à l’Université de Waseda———作者:左雯敏 Zuo Wenmin翻译:朱嘉雯 Zhu Jiawen20208开设“《论语》精读”课主要有以下三方面的考虑。
Lautomatisation de la correction des compositions en anglais est une avancée technologique qui aide les enseignants et lesétudiantsàgagner du temps etàaméliorer lévaluation des compétences en langue.Voici quelqueséléments clésàconsidérer lors de lutilisation dun système dautocorrection pour les compositions en anglais:1.Technologies danalyse de langage:Les systèmes dautocorrection utilisentgénéralement des technologies danalyse de langage naturel NLP pourévaluer la grammaire,la syntaxe,la ponctuation et la structure des compositions.2.Algorithmes de correction:Ces systèmes sontéquipés dalgorithmes sophistiqués qui peuvent identifier les erreurs et proposer des corrections appropriées.Ils peuventégalement fournir des suggestions pour améliorer la clartéet la précision du texte.3.Évaluation de la cohérence et de la cohérence:Outre la correction des erreurs de grammaire,les systèmes dautocorrection peuventégalementévaluer la cohérence et la cohérence du texte,en identifiant les ruptures de flux et en suggérant des ajustements pour améliorer la fluiditédu discours.4.Analyse de la richesse lexicale:Certains outils peuventévaluer la variétédu vocabulaire utilisédans une composition et recommander des synonymes pouréviter la répétition de mots.5.Feedback personnalisé:Les systèmes dautocorrection peuvent fournir des commentaires individuels sur chaque erreur,ce qui permet auxétudiants de comprendre pourquoi une certaine construction est incorrecte et comment laméliorer.6.Intégration avec les outils de formation:Les systèmes dautocorrection peuventêtre intégrés dans les plateformes dapprentissage en ligne,permettant auxétudiants de soumettre leurs compositions et de recevoir des commentaires en temps réel.7.Amélioration continue:Les systèmes dautocorrection saméliorent constamment grâce àlapprentissage automatique etàlajout de nouvelles fonctionnalités pour mieux répondre aux besoins des utilisateurs.8.Révision humaine:Même avec les avancées technologiques,il est important de rappeler que la révision humaine reste essentielle pourévaluer les aspects créatifs et les nuances de la langue,qui peuvent ne pasêtre capturés par les systèmes automatisés.9.Accessibilitéet utilisation:Les outils dautocorrection doiventêtre facilesàutiliser et accessiblesàtous lesétudiants,quelle que soit leur compétence en anglais.10.Protection de la vie privée:Lorsque des compositions sont soumises en ligne,il est important que les systèmes dautocorrection respectent la vie privée desétudiants et assurent la sécuritéde leurs données.En résumé,lautocorrection des compositions en anglais est un outil précieux qui peut aideràaméliorer lévaluation et lapprentissage de la langue,mais elle doitêtre utilisée en complément avec la révision humaine et avec une attention particulière aux aspectséthiques et de confidentialité.。
27. La revanche de Marie Curie"Laissez entrer tout le monde, exceptéles dames. Le président de l’Académie des sciences1,étonnépar la foule qui se réunit ce 23 janvier 1911 aux portes de la maison, fait le choix du sexe. Elles se sentaient pourtant très concernées, les dames:l'une d'entre elles, et non des moindres, voulait être admise dans le saint des saints2. Marie Curie, physicienne célèbre, prix Nobel de physique,découvreur du radium, demandait le fauteuil que Pierre, son mari, avait obtenu, après plusieurs refus durement exprimés, en 1906,quelques mois avant sa mort.La dispute "de la jupe et de la barbe3" n'explique pas à elle seule la violence de la discussion. Marie Curie, née Sklodowska, luttait pour la science, sa seule passion.Mais l'élection fut l'occasion de ranimer des débats politiques sales, dont toute une partie de la presse trouva son plaisir. A Marie Curie, soutenue par le mouvement des“libres penseurs”, on opposa BranLy, l'inventeur de la télégraphie sans fil. Au second tour, Marie Curie fut écartée. Elle en gardera secrètement une blessure au coeur.Elle naquit sous le joug russe, à Varsovie ( Pologne) ,le 7 novembre 1867,cadette d'une famille de cinq enfants,141Son père enseignait la physique et sa mère dirigeait une école de jeunes filles. "Le premier lut transmit son esprit de raison. De sa mère, elle hérita le sens du devoir".À 15 ans, elle fréquente avec ses sœurs l’Université Volante ,organisée par des intellectuels libres. Mais la famille Sklodowska tirait le diable par la queue4 et Marie dut quitter Varsovie pour aller en province ,où elle enseigna dans une famille riche. C'est àl'âge de 24 ans seulement qu'elle put enfin s'inscrire à la Sorbonne. Deux ans plus tard, malgré la fatigue et le manque de nourriture, Marie obtint une licence de physique, puis, celle de mathématiques. Rien n'allait plus arrêter ses études. Elle rencontra Pierre Curie, docteur ès sciences physiques, de seize ans son aîné, qu'elle épousa le 26 juillet 1895 . Compagnons dans la vie, ils deviendront aussi d'inséparables collègues de laboratoire unis par leur amour de la "science pure",En travaillant sur des matières riches en uranium ,Marie découvrit un élément radioactif, le polonium, et, en décembre 1902 f le radium, beaucoup plus puissant. Les Curie expliquèrent les premiers que le rayonnement émis provenait de son atome, indépendamment de toute réaction chimique. Marie détermina le poids atomique du radium, puis elle établit son étalon de mesure intemational.En 1903,le couple reçut le prix Nobel de physique. Leur santé n'était pas bonne. Pierre souffrait d'une grande142faiblesse et de graves brûlures aux doigts. Personne n'osait toucher le radium ,manipulé par nos deux savants à longueur de journée. Son mari 9Pierre mourut d'un accident ,écrasé sous les roues d'un fiacre parisien. Marie se consacra plus que jamais àla physique, et devint la première femme professeur à Ja Sorbonne. Elle nourrissait le rêve d'un Institut du radium oùl T on préciserait le rôle de celui-ci dans le traitement du cancer. L'Institut ne vit le jour qu'en 1919 f après la guerre, durant laquelle Marie devint célèbre en créant un service pour s'occuper des blessés.Sa guerre personelle ,Marie Curie levait vécue en 1911, Un journal local avait publiéses lettres avec Paul Langevin. Marie nourrissait de tendres sentiments pour le beau physicien,marié et père de quatre enfants. La voilàhuée par la foule2 "Dehors f la Polonaise! " Marie avait dû se cacher. Le prix Nobel de chimie ne diminuerait ni sa peine ni sa honte. Elle travaillerait jusqu'au bout, aveugle, tellement irradiée qu'une leucémie l'emporta le 4 juillet 1934. Plus de soixante ans après, ses cendres et celles de son mari entrent au Panthéon5.VOCABULAIRErevanche n. f. 报复radium n . m .镭refus n.m. 拒绝dispute n.f. 争吵143débat n . m, 辩论télégraphie n . f. 电报joug n . m . 枷锁licence n 学士学位uranium ?n. m. 铀radioactif, ve a . 放射性的poloniurn n . m . 镨rayonnement n . m. 射线étalon n . m . 标准manipuler v.t. 配制fiacre n.m. 四轮马车huer v.t. 嘲骂irradier v.t.(用放射线)照射leucémie n. f. 白血病cendre n. f 灰烬pl 骨灰NOTES1. l’Académie des Sciences法兰西(学院)科学院2. le saint des saints最神圣的地方。
DISQUE PORTABLEFiche techniqueRepousser les limites du possibleNous avons créé un disque portable exceptionnel, le Seagate Seven™, pour célébrerplus de 35 années d’expérience et d’innovation dans le domaine du stockage.Ce produit hommage est l’illustration parfaite de cette alliance entre rechercheet développement avancés et conception industrielle de pointe, pour donner naissanceau plus fin des disques portables 500 Go. Nous avons logé le Seagate Seven dansun boîtier entièrement fait d’acier pour créer à la fois le disque externe le plus findu marché et un objet élégant rappelant l’essence du stockage : un disque nu. Pourparfaire le tableau, ce disque est fourni avec un câble USB 3.0 tressé, performantet esthétique, à l’opposé des câbles standards qui accompagnent la plupart desdisques externes. En outre, le Seagate Seven est alimenté par le bus. Il tire donc sonénergie directement du port USB et ne requiert aucune alimentation externe, ce quien fait un allier idéal pour vos déplacements. Repoussez les limites du possible avecle Seagate Seven, le disque portable le plus fin du marché.DISQUE PORTABLEAMÉRIQUESSeagate Technology LLC 10200 South De Anza Boulevard, Cupertino, California 95014, United States, +1 408 658 1000 ASIE/PACIFIQUE Seagate Singapore International Headquarters Pte. Ltd. 7000 Ang Mo Kio Avenue 5, Singapour 569877, +65 6485 3888 EUROPE, MOYEN-ORIENT ET AFRIQUESeagate Technology SAS 16-18 rue du Dôme, 92100 Boulogne-Billancourt, France, +33 (0)1 41 86 10 00© 2015 Seagate Technology LLC. Tous droits réservés. Seagate, Seagate Technology et le logo Wave sont des marques ou des marques déposées de Seagate Technology LLC ou de l’une de ses filiales aux États-Unis et/ou dans d’autres pays. Seagate Seven est une marque ou une marque déposée de Seagate Technology LLC ou de l’une de ses filiales aux États-Unis et/ou dans d’autres pays. Les autres noms de produits cités sont des marques ou des marques déposées de leurs propriétaires respectifs. En termes de capacité de disque, un gigaoctet (Go) équivaut à un milliard d’octets. La capacité accessible peut varier en fonction des normes de mesure du système d’exploitation de l’ordinateur hôte. En outre, certaines capacités répertoriées ci-dessus sont utilisées pour le formatage, entre autres fonctions, et ne sont donc pas disponibles pour le stockage de données. Il est de la responsabilité de l’utilisateur de se conformer aux lois applicables relatives aux droits d’auteur. Seagate se réserve le droit de modifier sans préavis les offres ou les caractéristiques de ses produits. DS1837.2-1501FRAvec Mac, un reformatage peut être nécessaire.La compatibilité peut varier en fonction de la configuration matérielle et du système d’exploitation de l’utilisateur. En termes de capacité de disque, un gigaoctet (ou « Go ») équivaut à un milliard d’octets.。
新大学法语1(下)_山东大学中国大学mooc课后章节答案期末考试题库2023年1.Les enfants ______ les mains avant de se passer à table.参考答案:se sont lavé2.Philippe ______ resté dans la salle de lecture pendant deux heures.参考答案:est3.--Vous avez bu du vin rouge ?-- Oui, j’______ ai bu.参考答案:en4.-- Prends-tu de la soupe au petit-déjeuner?-- Non, je ne (n’) ______ prends pas.参考答案:en5.-- Qu’est-ce que vous prenez comme dessert?-- Je ne prends pas ______ dessert.Je n’aime pas ______ dessert.参考答案:de ; le6.Cette ______ dame est un peu malade.参考答案:vieille7.Mini, son chien l'______ déjà devant la porte.参考答案:attend8.J’ai déjà ______ ce film avec mes parents.参考答案:vu9.Ces revues sont intéressantes, je les ai déjà ______.参考答案:lues10.Nicolas est un ______ élève. Il aime ______ ses copains de classe.参考答案:bon ; bien11.Sophie ______ lève de bonne heure le matin.参考答案:se12.-- Vous parlez souvent de la vie de l’université à tes parents?-- Oui, je ______parle souvent de la vie de l’université.参考答案:leur13.Il a encore envie ______ dormir, mais il ne veut pas rater le bus.参考答案:de14.-- Vous aimez les légumes?-- Oui, je (j’)______ aime très bien.参考答案:les15.--François est là, tu veux ______ voir?-- Oui, bien sûr, je vais ______ parler.参考答案:le ; lui16.Elles se sont ______ dans la rue et elles se sont ______ bonjours.参考答案:rencontrées ; dit17.Marine et moi, nous nous sommes ______ à la folie(疯狂地), mais nous noussommes ______ au bout de deux ans!参考答案:aimés ; quittés18.Nathalie prend toujours ______ poisson au restau-U, elle aime bien ______poisson.du ; le19.Hier, elle ______ pendant deux heures.参考答案:a marché20.C'est ______ qui a fait cela.参考答案:lui21.Paul? Oui, je (j’)______ connais bien.参考答案:le22.______ tu es malade, ne va pas en classe aujourd’hui.参考答案:Comme23.______ quoi est-ce que ta sœur s’occupe?参考答案:De24.Les étudiants parlent ______ choses intéressantes de l’université.des25.Il ne prend jamais ______ dessert.参考答案:de26.Il y a plus de trois cent soixante sortes(种类)de ______ en France.参考答案:fromages27.Quand elle a besoin ______ quelque chose, elle va au supermarché d'une petiteville voisine.参考答案:de28.Elles se sont ______ vers le rayon boucherie pour ______ choisir un kilo d e bœufet un poulet.参考答案:dirigées ; y29.Notre maison donne ______ la mer.参考答案:sur30.-- Vous êtes institutrice?-- Non, je ne (n’) _____ suis pas encore, je n’ai pas finimes études.参考答案:le31.Les Français passent beaucoup de temps ______ table.参考答案:à32.Tu veux aller à l’hôpital, mais comment tu ______ vas?参考答案:y33.Je ______ partout mon stylo, mais je ne peux pas le ______.参考答案:cherche ; trouver34.______ à l’heure, mes enfants!参考答案:Soyez35.Il n’y a plus de légumes à la maison. ______!参考答案:Achètes-en36.Hier matin, Pierre ______ de bonne heure.参考答案:est sorti37.-- Ils sont contents de leurs enfants?-- Oui, ils ______ sont contents.参考答案:以上都不对38.选出不是一类的单词参考答案:coiffure39.Julie, je la ______ très bien.参考答案:connais40.Je ne ______ pas faire la cuisine.参考答案:sais41.Ma grand-mère est morte ______ un mois.参考答案:il y a42.Je ______ ai écrit plusieurs fois, mais elle ne m'a pas répondu.参考答案:lui43.Mes parents ______ à Paris il y a dix ans.参考答案:ont vécu44.Ils ont besoin de deux cafés. Donnez-______ deux cafés!参考答案:leur45.C'est sa mère qui est ______ à Paris.参考答案:arrivée。
The Canadian Journal of StatisticsVol.28,No.2,2000,Pages???-???La revue canadienne de statistiqueMultivariateflattening for better pre-dictionsMartin BILODEAUUniversit´e de Montr´e alKey words and phrases:Multivariateflattening,multivariate regression,prediction, risk.Mathematics subject classification codes(1991):primary62J07;secondary62H12. ABSTRACTMultivariate regression with p responses as opposed to p multiple regressions is getting increasingly more attention,especially in the context of prediction.Multivariateflat-tening methods are investigated as a way to obtain improved predictions over ordinary least-squares.With respect to sum of squares of prediction error,or SPE risk,an unbi-ased estimate of the risk is derived for two recent prediction methods,OPT and GCV, proposed by Breiman&Friedman(1997).Expressions for the exact SPE risk of OPT and GCV are derived generally for p≥1and evaluated numerically for p=1.R´ESUM´ELes m´e thodes de pr´e vision de p variables utilisant la r´e gression multivari´e e,plutˆo t que p r´e gression multiples,sont de plus en plus utilis´e es.Le r´e tr´e cissement multivari´e est´e tudi´e comme m´e thode de pr´e vision pour am´e liorer la m´e thode des moindres carr´e s.On obtient l’estimateur sans biais du risque SPE de deux m´e thodes r´e centes de pr´e vision,la m´e thode OPT et celle du GCV de Breiman et Friedman(1997).Une expression pour le risque exact de OPT et GCV est obtenue lorsque p≥1et une´e valuation num´e rique en est faite quand p=1.1.INTRODUCTIONThe problem of predicting several,possibly correlated,responses from the same set of predictors is becoming increasingly important.Applications by Breiman& Friedman(1997)(denoted hereafter by BF)include prediction of changes in the valuations of stocks in60industry groups by using over100econometric variables as predictors.Or,in chemometrics the prediction of6output characteristics of the polymers produced as predicted by22predictor variables.The model is the common multivariate regression model with p responses and1k predictors on n independent observations,Y=XB+E,where the error terms are assumed to be normally distributed,E∼N n p(0,I⊗Σ),Σ>0(positive definite),and X is an n×k matrix of rank k.The design matrix X is usually random in which case we assume that it is independently distributedof the error terms.Let|=E.=denote mutual independence so that X| The ordinary least-squares estimate of B isˆB OLS=(X X)−1X Y=(ˆb1,...,ˆb p),whereˆb i=(X X)−1X y i.Prediction of a“future”observation of p responses,y, at a given value of the predictor,x,assuming the same modely=B x+eis still valid,based on OLS is done in the obvious wayˆy OLS=ˆB OLS x=(ˆb 1x,...,ˆb p x) .We assume that“future”is independent of the“past”;i.e.,(x,e)|=(X,E).So,prediction of y1,...,y p is done independently via each of the p multiple regres-sions.This paper looks into improved predictions,˜y,by multivariate“flattening”techniques˜y =ˆy OLS A,x ˜B=x ˆB OLS A,which means prediction of the i th response is accomplished via a linear combina-tion,through the i th column of A:p×p,of all the p response predictions.To evaluate the performance of a prediction we evaluate an expected loss func-tion(risk).Consider the prediction of y by˜y=˜B x for any estimate˜B of B with respect to SPER(sum of squares of prediction error when the independent variable is random)motivated by Stein(1960)E(y−˜y) Σ−1(y−˜y)=p+E tr(˜B−B)Σ−1(˜B−B) Ω,whereΩ=E xx .SPER is obtained on subtracting p from the aboveR SPER(˜B)=E tr(˜B−B)Σ−1(˜B−B) Ω.A closely related risk function denoted SPE by Dempster et al.(1976)isR SPE(˜B)=E tr(˜B−B)Σ−1(˜B−B) X X.The SPE risk was investigated by van der Merwe&Zidek(1980)and Bilodeau& Kariya(1989).It is the most convenient risk for mathematical reasons.A canonical form of this problem which simplify notations and derivations is as follows.LetV=Y [I−X(X X)−1X]Y2be the residuals sum of squares.Then,given X ,ˆB OLS ∼N k p (B ,(X X )−1⊗Σ),V ∼W p (n −k,Σ),ˆBOLS |=V .The problem in its canonical form will be to estimate B ,with respect to SPE riskR SPE (˜B)=E tr (˜B −B )Σ−1(˜B −B ) C −1,based on Z and V whose conditional distribution given C :k ×k isZ ∼N k p (B ,C ⊗Σ),V∼W p (m,Σ),Z|=V .Results in terms of the canonical problem can be transposed to the original formu-lation with the correspondanceZ ↔ˆBOLS ,C ↔(X X )−1,m ↔(n −k ),V ↔V ,k ↔k,p ↔p.Van der Merwe &Zidek (1980)proposed FICYREGˆB FICYREG =Z I −r (Z C −1Z )−1V,where r =(k −p −1)/(m +p +1)and establisedR SPE (ˆBFICYREG )<R SPE (Z )=pk,or,FICYREG improves uniformly over OLS.Bilodeau &Kariya (1989)producedmany other improved predictions and showed the Efron-Morris (EM)estimateˆBEM =ˆB FICYREG −s V /tr(Z C −1Z ),s =(p −1)/(m +p +1),improves uniformly over FICYREG.Attention to this problem was revived recently by BF,in a paper commentedby 26discussants,who proposed two multivariate “flattening”techniques,ˆBGCV and ˆBCV based,respectively,on generalized cross-validation and ordinary cross-validation.A very extensive simulation convincingly reports notable risk reduction over other commonly used prediction methods.In the idealized situation,assuming B ,Σ,and Ω,are known they considered as well the optimization problemmin A(y −A ˆyOLS ) (y −A ˆy OLS )and obtainedA =[I +r (B ΩB )−1Σ]−1,for a certain scalar r .This leads for p ≤k to the sample versionˆBOPT =Z I +r (Z C −1Z )−1V−1.32.MAIN RESULTSIn this section we investigate conditions under which ˆBOPT and ˆB GCV (2)lead to improved predictions over OLS.Both ˆBOPT and ˆB GCV have an expansion as r ↓0whose two first terms give ˆBFICYREG so from the result of van der Merwe &Zidek (1980)we expect there exists an interval 0<r <r 0such that ˆBOPT and ˆBGCV are uniformly better than OLS.The main tool is that of unbiased risk estimation developed by Stein (1981).Using a result of Golub &van Loan (1989)there exists a nonsingular W :p ×p such thatWVW=diag(λi )W (Z C −1Z )W=diag(γi ),(1)and thusW −1(Z C −1Z )−1VW =diag(x i ),where x i =λi /γi >0,i =1,...,p .Proposition 1.[van der Merwe &Zidek 1980]The SPE risk difference between FICYREG and OLS is unbiasedly estimated byˆR(ˆB FICYREG )−pk =x i ·r [r (m +p +1)−2(k −p −1)].This implies that for0<r <2(k −p −1)/(m +p +1),k >p +1,FICYREG has a SPE risk uniformly less than that of OLS.Proposition 2.The SPE risk difference between OPT and OLS is unbiasedlyestimated byˆR(ˆB OPT )−pk =2r x i (1+rx i )−1· (1+rx i )−1+2r x i (1+rx i )−2+2k (1+rx i )−1−2kp −2r (1+rx i )−2· (1+rx i )−1+2r (1+rx i )−1 2+2r (1+rx i )−2−2r (1+rx i )−3+(m −p −1) x −1i 1−(1+rx i )−1 2.The choice of the flattening matrix A can also be made with the GCV criteriaproposed by Craven &Wahba (1979).BF equation (3.9)showed this approximation reduces toˆBGCV =Z r 2(1−r )−1I + 2−(1−r )−1 I +(Z C −1Z )−1V −1 −1· −r I + I +(Z C −1Z )−1V−1 .(2)4The prescription for r is r =k/n ,n =k +m .For GCV the unbiased risk estimation is contained in the following proposition.Leth (x )=−r +(1+x )−1g (x )=r 2(1−r )−1+ 2−(1−r )−1(1+x )−1.Proposition 3.The SPE risk difference between GCV and OLS is unbiasedly estimated byˆR(ˆB GCV )−pk =−2 2−(1−r )−1x i (1+x i )−2h (x i )g (x i )−2+ (1+x i )−1g (x i )−1·x i (1+x i )−1h (x i )g (x i )−1+2kh (x i )g (x i )−1−2kp +2x i (1+x i )−2g (x i )−1+2 x i (1+x i )−1· (1+x i )−1g (x i )−1+2 2−(1−r )−1(1+x i )−1h (x i )g (x i )−2· (1+x i )−1h (x i )g (x i )−1− (1+x i )−1g (x i )−1·(1+x i )−1h (x i )g (x i )−1+ (1+x i )−2h (x i )2g (x i )−3−(1+x i )−2h (x i )g (x i )−2+2(1+x i )−1·(1+x i )−1g (x i )−1−2 (1+x i )−1· (1+x i )−1h (x i )g (x i )−2−2 (1+x i )−2h (x i )g (x i )−2+2(1+x i )−2g (x i )−1+(m −p −1) x −1i1−h (x i )g (x i )−1 2.Propositions 2and 3have important consequences regarding conditional (givenC )risk,as well as unconditional risk;i.e.,they apply when the predictor is consid-ered fixed or random.Suppose,under a condition on r ,that ˆR(ˆB GCV )−pk ≤0,for all x 1,...,x p >0.Then,averaging over the conditional distribution of the x i ’s given C ,R (ˆB GCV |C )−pk ≤0,for all positive definite matrix C .Averaging further over the distribution of C ,whatever it may be,R (ˆB GCV )−pk ≤0,for all possible parameters B ,Σ,and all distributions on the positive definitematrix C .For example,when the rows,x i ,of X are i.i.d.N k (0,Ω),then C−1has a W k (n,Ω)distribution.The determination of an interval for r such that the unbiased estimate of the risk difference between OPT (or GCV)with OLS is always (for all x i >0)non-positive is more difficult due to the complexity of the expressions.However,on the domain x 1=···=x p ≡x >0such an interval exists.Consideration of this domain leads to simplifications of estimated risks difference in Propositions 2and 3,to which Baranchik’s (1970)technique then applies.The hope is that estimated risks difference will remain nonpositive outside this particular domain.5This can be checked for a given value of r by plotting the function,representing the estimated risks difference,on several rays coming out of the origin.The domain x1=···=x p is only one such ray,which makes a45degrees angle with all the axes. Proposition4.Let k>p+1and definer OPT=2(k−p−1)/(m+p+1),r GCV=1+(m+p+1)2(k−p−1)+(m+p+1)2(k+14)(k−2)/[2(k−4)],where x denotes the smallest integer greater than or equal to x,known as the “ceiling”function.A plot of this minimum value of m versus k in Figure1shows that m need not be very large compared to k.Suchfinite sample properties of GCV,even for p=1,seem novel.6mkFigure1:Minimum value of m as a function of k≥5when p=1so that r=k/n ofˆB GCV belongs to the specified interval in Proposition4.In general,for given values of p,k,and m,a plot ofˆR(˜B)−pk versus x1,...,x p would show that˜B is minimax if the surface is always nonpositive.Figure2shows the surface plot of GCV for p=2and k=4.In the worst scenario m=1and r=r GCV,GCV is seen to be minimax.A similar result can be observed for OPT which is also minimax.The GCV,however,may not be minimax for the prescription r=k/n for small values of m=n−k as shown in Figure3.The surface plot is positive for small values of x1and x2which indicate GCV may not be minimax.Figure2:Unbiased estimate of the risk difference between GCV and OLS,ˆR(ˆB GCV)−pk,for p=2,k=4,m=1,and r=r GCV.7Figure 3:Unbiased estimate of the risk difference between GCV and OLS,ˆR(ˆB GCV )−pk ,for p =2,k =4,m =1,and r =k/n .A surface plot of the function ˆR(˜B )−pk for large values of p is not possible.However,on a given ray emerging from the origin in the positive quadrant and determined by a unit vector u ,one can plot this function at points t u ,on an interval 0≤t ≤a .For GCV,Figure 4shows that the prescription r =r GCV leads to a minimax prediction procedure;this may not be the case,however,for r =k/n when n is too small.12345t -300-250-200-150-100-50U12345t -400-300-200-100100200UFigure 4:Representation of U =ˆR(ˆB GCV )−pk on 10rays chosen at random in the positive quadrant.The values are p =20,k =50,and m =50.On the left r =r GCV =0.348,whereas on the right r =k/n =1/2.To get some insights into the new GCV method we made a comparison of exact8SPE risks when p=1.We use the notations Z=z and(Z C−1Z)−1V=x.The comparison is made between the positive part procedures(let[t]+=max(t,0))ˆb FICYREG+=1−k−2m+2−1z,ˆb GCV+=[h(x)/g(x)]+z,where in h(·)and g(·)we set r=k/n.When p=1the positive parts FI-CYREG+and GCV+are,respectively,better than FICYREG and GCV follows from Baranchik(1970).Note thatˆb OPT does not require a positive part correc-tion.The exact conditional risks are evaluated using the unbiased risk estimates,ˆR≡ˆR(x),and averaging over the conditional distribution of x.It is well known1/x follows a canonical F(k,m;d)conditional distribution[Johnson&Kotz(1970),p. 191]with noncentrality parameter given by c=b C−1b/σ2.Thus,the conditional risk is given byR(·|C)=∞i=0e−c/2(c/2)i2,m(1+y)(n+2i)/2dy.(3)Evaluation of unconditional risk requires averaging R in(3)over the distribution of c.For example,this can be done if C−1∼W k(n,Ω)in which case the distribution is simply c∼(b Ωb/σ2)χ2n.The unconditional risk is then a function of the signal-to-noise ratio d=b Ωb/σ2,R(·)=∞i=0d in/2+i)B−1n2,m(1+y)(n+2i)/2dy.(4)Examination of Figure5reveals for p=1,k=5,and m=40,that GCV+is better than FICYREG+and OPT for small signal-to-noise ratios,whereas OPT is the preferred method for large signal-to-noise ratios.90.51 1.52d12345Risk Figure 5:Comparison of exact risks as a function of signal-to-noise ratio d =b Ωb /σ2.Joined line is for OPT,dashed line corresponds to FICYREG+,whereas dot-dashed line represents GCV+.The values are p =1,k =5,and m =40.The evaluation of the exact risk of FICYREG,OPT,or GCV,when p >1would use the same idea.The exact joint conditional distribution of the eigenvalues x 1,...,x p given in Muirhead (1982,Theorem 10.4.2)is in terms of hypergeometric functions.Although it is known that this joint distribution depends on B and Σonly through the eigenvalues of the signal-to-noise matrix (B C −1B )Σ−1the evaluation of exact conditional risk still remains a difficult computational problem:R (·|C )=y 1>···>y p >0ˆR (y −11,...,y −1p )·etr−12n ;12Θ,F (I +F )−1·Γp1Γp12(m ) πp2/22pp i =1y (k −p −1)/2iso that the flattening matrix A is positive semidefinite.Risk of these estimates are minimum at B =0and they are said to shrink towards 0.Multivariate flattening yields substantial risk reduction especially when the estimate shrinks to a point close to the “true”B .We have (conditionally and,thus,unconditionally)for a general estimate ˜B=˜B (Z ,V )R SPE ˜B (Z ,V );B −B (0),Σ =R SPE B (0)+˜B (Z −B (0),V );B ,Σ .Thus,ˆB (0)FICYREG+=B (0)+ Z −B (0) W (0) diag (1−rx (0)i )+ W (0) −1,ˆB (0)GCV+=B (0)+ Z −B (0) W (0) diag h (x (0)i )/g (x (0)i ) + W (0) −1,ˆB (0)OPT=B (0)+ Z −B (0) I +r Z −B (0) C −1 Z −B (0) −1V −1,whereW (0) −1 Z −B (0) C −1 Z −B (0) −1VW (0) =diag x (0)i,should have good risk performance around B =B (0).ACKNOWLEDGEMENTSThis research was supported in part by a grant from the Natural Sciences and Engineering Research Council of Canada.APPENDIXLemma 1.[Bilodeau &Kariya 1989]Let ˜B =Z +G (Z ,V )be an arbitrary estimate,where G =(g ij ),Z =(z ij ),and V =(v ij ).Assume E g 2ij <∞,E |∂g ij /∂z kl |<∞,E (∂g ij /∂v kl )2<∞,and the conditions in Theorem 2.1of Haff(1976)are satisfied.The unique unbiased estimate of the risk difference R (˜B)−pk is ˆR(˜B )−pk =2tr A +2tr TC −1+(m −p −1)tr GV −1G C −1,with A =(a ij ),T =(t ij )anda ij=p k =1∂g ik /∂z jk t ij =pk =1p l =1[g ik ·∂g jl /∂v kl +∂g ik /∂v kl ·g jl ](1+δkl )/2.Proof of Proposition 2:DefineG (Z ,V )=Z I +r (Z C −1Z )−1V−1−Z 11andU =I +r (Z C −1Z )−1V .Then the derivatives in Lemma 1are obtained as ∂G /∂z jk =Z ∂∂z jkU ·U −1+e j e k U −1−e j e k =−r ZU −1∂∂z jk (Z C −1Z )·(Z C −1Z )−1VU −1+e j e k U −1−e j e k =r ZU −1(Z C −1Z )−1 Z C −1e j e k+e k e j C −1Z ·(Z C −1Z )−1VU −1+e j e k U −1−e j e k .One then extracts ∂g ik /∂z jk from ∂G /∂z jk and easily checks thatA =r tr (Z C −1Z )−1VU −1 ·ZU −1(Z C −1Z )−1Z C −1+r ZU −1(Z C −1Z )−1U −1V (Z C −1Z )−1Z C −1+tr U −1 ·I −p I .Diagonalizing with the matrix W (1)the trace of A reduces totr A =r x i (1+rx i )−1· (1+rx i )−1+r x i (1+rx i )−2+k (1+rx i )−1−kp.Now,we evaluate T with∂G /∂v kl =Z ∂U −1/∂v kl =−ZU −1∂U /∂v kl ·U −1=−r ZU −1(Z C −1Z )−1∂V /∂v kl ·U −1=−r ZU −1(Z C −1Z )−1{e k e l +e l e k }1Then after very lengthy but straightforward algebra one can check thatˆR(ˆB OPT)−pk=px(m+p+1)w1(x)2−2(k−p−1)w1(x)+2(p+1)pw 1(x)[1+w1(x)]x2.(5) Since w1(x)>0,w 1(x)<0,and lim x↓0w1(x)=r,thenˆR(ˆB OPT)−pk<0if 0<r<2(k−p−1)/(m+p+1),k>p+1.For GCV the equation(5)is still validbut withw2(x)=x−11−h(x)g(x)−1.Since w2(x)>0,w 2(x)<0,and lim x↓0w2(x)=r/(r−1)2,we getˆR(ˆB GCV)−pk< 0if0<r/(r−1)2<2(k−p−1)/(m+p+1).Solving this quadratic equation for r gives the result.REFERENCESBaranchik,A.J.(1970).A family of minimax estimators of the mean of a multivariate normal distribution.Ann.Math.Statist.,41,642–645.Bilodeau,M.,&Kariya,T.(1989).Minimax estimators in the normal MANOVA model.J.Multivariate Anal.,28,260–270.Breiman,L.,&Friedman,J.H.(1997).Predicting multivariate responses in multiple linear regression.J.R.Statist.Soc.B,59,3–54.Craven,P.,&Wahba,G.(1979).Smoothing noisy data with spline functions:estimat-ing the correct degree of smoothing by the method of generalized cross-validation.Numer.Math.,31,317–403.Dempster,A.P.,Schatzoff,M.,&Wermuth,M.(1977).A simulation study of alterna-tives to ordinary least-squares.J.Amer.Statist.Assoc.,72,77–106.Golub,H.G.,&van Loan,C.F.(1984).Matrix Computations2nd ed..John Hopkins University Press,Baltimore.Haff,L.R.(1976).An identity for the Wishart distribution with applications.J.Mul-tivariate Anal.,9,531–544.Johnson,N.L.,&Kotz,S.(1970).Distributions in Statistics:Continuous Univariate Distributions-2.Wiley.Muirhead,R.J.(1982).Aspects of Multivariate Analysis.Wiley.Stein,C.(1960).Multiple regression.Contrib.Prob.Statist.(Hotelling volume), 424–443.Stein,C.(1981).Estimation of the mean of a multivariate normal distribution.Ann.Statist.,9,1135–1151.van der Merwe,A.,&Zidek,J.V.(1980).Multivariate regression analysis and canonical variates.Canad.J.Statist.,8,27–39.Received10December1998D´e partement de math´e matiques et de statistique Accepted17June1999Universit´e de Montr´e alC.P.6128,succursale Centre-villeMontr´e al(Qu´e bec)Canada H3C3J7e-mail:bilodeau@dms.umontreal.ca13。